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本 篇 介绍 数据 库 系统 的 基本 概念 ,基础 理论 知识 和 数据 管理 发 
展 历 史 , 并 从 逻辑 数据 模型 的 三 个 方面 详细 地 阐述 关系 数据 库 。 本 
篇 是 后 面 章节 的 基础 ,也 是 本 课程 的 入 门 。 

本 篇 包含 以 下 章节 。 

第 1 章 绪论 ,介绍 数据 库 应 用 举例 ,重点 阐述 数据 库 系统 的 
基本 概念 ,详细 说 明了 逻辑 数据 模型 的 构成 及 分 类 ,讲述 数据 库 系 
统 的 三 级 模式 结构 及 体系 结构 ,介绍 数据 管理 技术 发 展 的 三 个 阶段 
以 及 DBMS 组 成 。 其 中 ,DBMS 组 成 为 选修 内 容 。 

第 2 章 关系 模型 数据 库 ,详细 介绍 了 关系 模型 数据 库 的 数据 
结构 ,以 及 关系 模型 数据 库 的 三 大 完整 性 约束 。 

第 3 章 关系 代数 ,介绍 关系 模型 操作 语言 ,重点 讲述 关系 代 
数 运算 。 


第 1 章 绪 论 


数据 库 是 一 门 非常 重要 的 课程 ,其 理论 知识 及 技术 应 用 相当 广泛 。 是 信息 类 学 科 必 
须 掌 握 的 内 容 , 而 且 近 几 年 它 的 理论 知识 及 技术 发 展 、 更 新 达到 了 一 个 新 的 高 潮 。 

“数据 库 ? 不 仅 是 计算 机 类 专业 、 信 息 管 理 信息 系统 .计算 机 网 络 , 大 数据 等 相关 专业 
的 专业 基础 必修 课程 ,也 是 很 多 非 计算 机 专业 的 选修 课程 。 

本 章 介绍 数据 库 应 用 举例 ,重点 阐述 数据 库 系 统 的 基本 概念 ,详细 说 明了 逻辑 数据 模 
型 的 构成 及 分 类 ,讲述 数据 库 系 统 的 三 级 模式 结构 及 体系 结构 ,介绍 数据 管理 技术 发 展 的 
三 个 阶段 以 及 DBMS 组 成 。 通 过 本 童 的 学 习 , 可 以 了 解数 据 库 数据 库 系统 的 概貌 。 


1.1 概述 


随 着 计算 机 技术 ,通信 技术 以 及 互联 网 的 蓬勃 发 展 ,人 们 对 数据 的 需求 日 益 递增 , 数 
据 量 呈 现 爆炸 式 增 长 。 当 今 是 数据 的 时 代 , 涌现 了 各 种 类 型 的 应 用 型 数据 ,如 物 联网 数 
据 ` 无 线 网 络 数据 .GPS 数据 .3D 数据 多 媒体 数据 ,社交 网 络 数据 ` 自 媒体 数据 以 及 大 规 
模 的 历史 数据 等 。 这 些 数据 的 存储 表示 、\ 处 理 、 传 输 要 用 到 数据 管理 技术 。 在 人 们 的 生 
活 中 ,有 关 数 据 的 应 用 无 处 不 在 ,如 银行 航空 公司 高校 .销售 ,在线 销 售 、 医 院 ` 人 力 资 
源 等 。 

银行 需要 存储 客户 的 基本 信息 ,账户 信息 ,存款 信 息 、 取 款 信息 .转账 信息 、 借 款 信 
息 等 。 
航空 公司 需要 存储 旅客 信息 ,票务 信息 ,航班 信息 、. 订 票 信息 等 。 
高 校 需要 存储 学 生 信息 、 教 师 信 息 、 课 程 信息 、 排 课 信息 选课、 成绩 ,甚至 学 校 的 贴吧 
及 论坛 ,这 些 信息 都 保存 在 学 校 的 数据 库 中 。 

销售 方面 ,如 沃尔玛 等 大 型 国际 连锁 超市 的 货物 信息 、 库 存 信息 、 销 售 信息 等 都 保存 
在 数据 库 中 。 

在 线 销售 ,如 大 型 电子 商务 网 站 “淘宝 ”的 商品 信息 、 客 户 信 息 、 销 售 记录 等 数据 都 保 
存在 数据 库 中 。 

医院 需要 保存 病人 的 基本 信息 ,诊断 信息 \ 病 例 、 医 生 的 相关 信息 等 ,这 些 信息 都 保存 
在 医院 的 数据 库 里 ,以 便于 随时 获取 。 

人 力 资 源 需要 保存 每 个 员工 的 基本 信息 、 休 假 奖 惩 记录 ,薪资 等 信息 。 

可 以 说 ,当今 时 代数 据 无 处 不 在 ,人 们 随时 随地 都 需要 查看 数据 ,保存 数据 、 管 理 数 
据 、 搜 索 数据 分析 数 据 。 这 些 数 据 一 般 都 保存 在 专门 的 数据 库 里 。 

商家 经 常 根据 顾客 的 购买 历史 记录 及 浏览 过 的 产品 为 顾客 推荐 商品 ,有 时 候 在 超市 
里 会 看 见 尿 片 与 啤酒 摆 放 在 一 起 ,银行 根据 客户 的 信用 记录 决定 是 否 为 客户 发 放贷 款 等 ， 
这 些 都 是 从 数据 中 挖掘 出 规律 然后 应 用 于 生活 中 的 例子 。 


数据 库 原理 及 应 用 


目前 , 物 联网 (Internet of Things,IoT) 已 经 形成 ,而 且 发 展 迅 速 。 物 联网 指 的 是 物 物 
相连 的 互联 网 ,如 智能 家 居 。 物 联网 中 的 设备 能 够 通过 互联 网 收集 并 传送 数据 ,构成 物 联 
网 的 数据 世界 。 


1.1.1 数据 库 的 基本 概念 


在 深入 学 习 其 他 内 容 前 ,本 节 首 先 讲述 与 数据 库 技术 最 密切 相关 的 几 个 基本 概念 ,如 
数据 、 数 据 库 数 据 库 管 理 系统 数据 库 系 统 数据 库 用 户 。 


1. 数据 


数据 (data) 用 来 描述 世界 ,有 具体 的 意思 ,有 各 种 表现 形式 ,包括 数字 、 字 母 , 文 本 、 图 
像 声 音 、 音 频 、 视 频 等 。 例 如 : 


张杨 , 男 ,1998, 长 沙 , 计 算 机 科学 与 技术 ,2016 


该 数据 如 果 保 存在 学 生 信息 管理 系统 中 ,可 以 解释 为 : 张扬 ,男性 ,长 沙 人 ,出 生 于 
1998 年 ,2016 年 被 计算 机 科学 与 技术 专业 录取 。 
数据 可 以 被 存储 、 处 理 和 传输 。 


2. 数据 库 


数据 库 (DataBase,DB) 是 保存 数据 的 仓库 , 仅 是 一 些 相 关 数 据 的 集合 ,可 以 长 期 保存 
在 计算 机 内 ,是 有 组 织 的 ,可 共享 的 大 量 数据 的 集合 。 数 据 库 中 的 数据 按 一 定 的 数据 模型 
组 织 , 描 述 和 储存 ,具有 和 较 小 的 元 余 度 、 较 高 的 数据 独立 性 和 易 扩展 性 ,并 可 为 各 种 用 户 
共享 。 

下 面 是 一 个 简单 的 数据 库 例子 , 仅 包 含 一 个 表 。 

学 生 信息 管理 系统 中 使 用 的 学 生 数 据 库 只 包含 一 个 学 生 表 。 学 生 表 描述 学 生 的 基本 
信息 ,包括 学 号 、 姓 名、 年龄 .性别 .专业 ,人 学 年 份 ,如 图 1. 1 所 示 。 











图 1.1 学 生 数据 库 


生活 中 的 数据 库 例 子 并 不 像 学 生 数据 库 那样 简单 。 下 面 给 出 另 一 个 例子 ,一 个 简单 














的 银行 数据 库 , 包 含 客户 信息 、 存 款 信息 、 账 号 信息 ,如 图 1.2 所 示 。 


192-83-7465 
012-28-3746 
677-89-9011 
182-73-6091 
321-12-3123 
336-66-9999 
019-28-3746 





账户 表 


account-id balance 


Johnson 
Smith 
Hayes 


华尔街 8 号 
市 场 街 4 号 


Turner 


Jones 


Lindsay 
Smith 





101 
215 
102 
上 305 
Ar201 
i217 
222 








192-63-7465 
192-63-7465 
019-28-3746 
677-69-9011 


182-73-6091 
321-12-3123 
336-66-9999 
019-28-3746 


图 1.2 银行 数据 库 





诺 曼 蒂 大 街 29 号 

好 莱 坞 大 道 56 号 

马里 兰 大 道 100 号 
唐人 街 53 号 
公园 路 12 号 


存款 表 


客户 表 


纽约 市 
华盛顿 市 
西雅图 市 
洛杉矶 市 
芝加哥 市 
休斯顿 市 
华盛顿 市 





account-id 


A-101 
A-201 
A215 
A-102 
A-305 
A217 
A-222 
A-201 





客户 表 描 述 客 户 的 基本 信息 ,包含 客户 编号 (customer-id)、 客 户 姓 名 (customer- 
name) ,客户 居住 的 城市 (customer-city) 和 街道 地 址 (customer-street)。 账 户 表 包含 账户 
编号 (account-id) 及 余额 (balance) 信 息 。 存 款 表 包含 客户 编号 (customer-id) 及 账户 编号 
(account-id) 信 息 , 描 述 了 客户 与 账户 之 间 的 关系 。 一 个 客户 在 某 家 银行 可 能 有 多 个 


账号 。 


3. 数据 库 管 理 系统 


数据 库 管 理 系统 (DataBase Management System,DBMS) 是 一 组 程序 的 集合 ,用 来 存 
储 数 据 到 数据 库 , 并 可 以 修改 和 获取 数据 库 中 的 数据 。 DBMS 有 很 多 种 类 型 ,包括 运行 
在 个 人 计算 机 上 的 小 系统 到 运行 在 大 型 主机 上 的 大 系统 。 


4. 数据 库 系统 


数据 库 系 统 (DataBase System,DBS) 由 硬件 .软件 .人 员 构 成 ,其 中 软件 包括 操作 系 
统 、 数 据 库 、 数 据 库 管理 系统 、 应 用 开发 工具 、 应 用 程序 等 ,人 员 包 括 数 据 库 管理 员 
(DBA)、 应 用 程序 员 以 及 用 户 等 ,如 图 1. 3 所 示 。 
计算 机 硬件 是 基础 ,包括 CPU、 输 入 输出 设备 ,需要 有 足够 大 的 内 存 存放 操作 系统 、 
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软件 应 用 程序 应 用 程序 员 


1 
< 应 用 开发 工具 ”之 


是 
数据 库 管理 系统 


< 操作 系统 > 数据 库 管理 员 
i 
数据 库 


图 1.3 数据 库 系 统 























DBMS 核心 模块 ,数据 缓冲 区 及 应 用 程序 ;需要 有 足够 大 的 磁盘 存放 数据 库 及 备份 数据 
库 ; 需 要 有 较 高 的 通道 能 力 提高 数据 传送 率 。 

软件 包括 创建 管理、 维护 数据 库 的 DBMS, 支 持 DBMS 运行 的 操作 系统 ,开发 语言 、 
编译 系统 及 开发 环境 ,数据 库 应 用 程序 等 。 


5. 数据 库 用 户 


数据 库 系统 中 包含 的 数据 库 用 户 有 终端 用 户 、 系 统 分 析 员 ,数据 库 设 计 者 、 应 用 程序 
员 数据库 管理 员 。 系 统 分 析 员 负责 应 用 系统 的 需求 分 析 和 规范 说 明 ;数据 库 设 计 者 设计 
数据 库 中 数据 的 内 容 和 格式 等 ;应 用 程序 员 通过 应 用 开发 工具 开发 出 应 用 程序 实现 数据 
库 应 用 系统 的 功能 ;数据 库 管理 员 管 理 和 维护 数据 库 ;终端 用 户 通 过 访问 应 用 程序 (系统 ) 
获取 数据 库 管 理 系 统 维护 和 管理 的 数据 库 中 的 数据 ,而 数据 库 一 般 保 存在 磁盘 的 文件 上 ， 
由 操作 系统 进行 调用 。 实 际 上 ,从 数据 库 应 用 系统 设计 到 开发 的 过 程 中 ,这 些 人 员 都 需要 
相互 配合 ,真切 地 了 解 用 户 的 实际 需求 ,分 析 设 计 出 合适 的 数据 库 及 数据 库 应 用 系统 ,以 
供用 户 使 用 。 如 图 1.4 所 示 ,用 户 通过 数据 库 应 用 程序 访问 由 数据 库 管理 系统 维护 的 数 
据 库 。 

在 数据 库 的 几 类 用 户 中 ,数据 库 管理 员 (DBA) 的 责任 非常 重大 ,负责 全 面 管理 ,维护 
和 控制 数据 库 系 统 。 其 职责 有 以 下 几 点 。 

(1) 决定 数据 库 中 的 信息 内 容 和 结构 , 即 数据 库 中 存放 哪些 信息 及 其 格式 是 什么 ,这 
需要 DBA 的 全 程 参 与 ,并 与 用 户 、 应 用 程序 员 、 系 统 分 析 设 计 人 员 密 切合 作 。 

(2) 决定 数据 库 的 存储 结构 和 存 取 策 略 , 获 得 较 高 的 存 取 效率 和 空间 利用 率 。 

















全 一 ~ 数据 库 应 用 程序 数据 库 管理 系统 
用 户 


图 1.4 用 户 访问 数据 库 系 统 


(3) 定义 数据 的 安全 性 要 求 和 完整 性 约束 条 件 ,确保 数据 的 安全 性 和 完整 性 ,决定 用 
户 的 权限 级 别 、 数 据 的 保密 级 别 以 及 数据 的 约束 条 件 。 

(4) 监控 数据 库 的 使 用 和 运行 , 当 数 据 库 出 现 问题 时 ,DBA 必须 在 最 短 的 时 间 内 将 
数据 恢复 到 正确 的 状态 , 尽 可 能 地 减少 对 业务 的 影响 。 

(5) 数据 库 的 改进 和 重组 重 构 。 在 数据 库 的 运行 过 程 中 ,监视 系统 的 运行 ,并 提高 其 
性 能 ,或 者 根据 应 用 需求 的 变化 改进 数据 库 , 随 着 数据 不 断 插入 、 删 除 、 修 改 , 数 据 的 组 织 
结构 会 受到 影响 而 降低 性 能 ,因此 需要 定期 对 数据 库 进行 重组 织 ,而 当 用 户 的 需求 改变 很 
大 , 现 有 数据 库 无 法 满足 需要 时 ,应 重新 设计 数据 库 对 它 进行 重 构 。 


1.1.2 数据 库 管 理 系统 介绍 


数据 库 管理 系统 是 位 于 用 户 与 操作 系统 之 间 的 一 层 数据 管理 软件 ,主要 作用 是 建立 、 
运行 及 管理 维护 数据 库 , 它 的 功能 主要 包括 六 个 方面 。 

(1) 数据 定义 功能 ,定义 数据 库 中 数据 对 象 的 组 成 结构 .格式 ,包括 定义 数据 库 的 模 
式 、 存 储 模式 、 外 模式 、 映 像 ,定义 数据 约束 条 件 、 用 户 存 取 权限 。 

(2) 数据 操纵 功能 ,包括 对 数据 库 数据 的 检索 插入、 修改 、 删 除 等 基本 操作 。 

(3) 数据 库 事务 管理 及 运行 管理 ,包括 事务 的 正确 运行 .多 用 户 并 发 控制 保证 安全 
性 及 数据 完整 性 .运行 时 的 监管 与 控制 。 

(4) 数据 组 织 、 存 储 和 管理 。DBMS 负责 分 门 别 类 地 组 织 、 存 储 和 管理 库 中 的 数据 字 
典 、 用 户 数据 、 存 取 路 径 等 数据 ,确定 以 何 种 文件 结构 和 存 取 方 式 物理 地 组 织 这 些 数据 , 实 
现 数据 间 的 联系 ,并 提高 空间 和 时 间 效 率 。 

(5) 数据 库 建立 和 维护 。 建 立 包括 初始 数据 输入 和 数据 格式 转换 等 。 维 护 包括 数据 
的 转 储 , 恢 复 、 重 组 织 、 重 构造 ,性 能 监视 与 分 析 , 可 以 通过 数据 库 管理 系统 的 一 些 实用 工 
具 来 完成 。 

(6) 其 他 功能 ,如 数据 通信 接口 ,与 其 他 软件 系统 通信 。 

各 种 数据 库 管 理 系统 实现 的 功能 主要 有 以 上 六 个 方面 ,但 实现 方式 技术、 内 部 组 成 
等 都 各 不 相同 。 当 前 市 场 上 比较 流行 (或 曾经 流行 ) 的 一 些 关 系 DBMS 的 产品 见 表 1. 1。 
表 1.1 从 运行 的 平台 、 公 司 ,专业 性 \ 开 发 时 间 、 性 能 方面 展示 了 8 种 DBMS 产品 ,其 他 的 
非 关系 数据 库 产品 请 参考 17 章 的 图 17. 13。 














数据 库 原理 及 应 用 


表 1.1 数据 库 管理 系统 产品 




















产 品 平 “人 台 公 司 专业 性 开发 时 间 性 能 
VEFP、Access Windows 微软 非 专业 小 型 20 世纪 80 年 代 一 般 
MySQL 跨 平 台 Oracle 专业 中 小 型 20 世纪 90 年 代 好 
Oracle 跨 平 台 Oracle 专业 大 型 1979 年 好 
SQL Server Windows 微软 专业 大 中 型 1994 年 好 
Sybase 跨 平台 Sybase 专业 大 型 1987 年 好 
Informix 跨 平台 IBM 专业 大 型 1988 年 好 
Ingres 跨 平台 CA 专业 大 型 1975 年 好 
DB2 AS/400 等 IBM 专业 大 型 1987 年 好 


其 中 ,MySQL、Oracle、SQL Server 占据 了 市 场 的 绝 大 部 分 份额 。 本 书 编写 的 SQL 
语句 都 能 运行 于 SQL Server 环境 下 ,基本 可 以 运行 在 Oracle 和 MySQL 环境 下 。 


1.1.3 示例 











下 面 为 学 生成 绩 管 理 系统 建立 STUDENT 数据 库 ,数据 库 设 计 者 与 学 生 及 教师 用 户 
交流 后 ,设计 出 该 数据 库 包含 STUDENT 学 生 表 、COURSE 课程 表 、SECTION 学 期 表 、 
GRADE_REPORT 成 绩 表 和 PREREQUESIT 先 修 课程 表 , 如 表 1.2 一 表 1.6 所 示 。 


表 1.2 STUDENT 学 生 表 








姓 名 学 号 班 级 专 业 
三 1 1 计算 机 科学 
李 四 8 2 计算 机 科学 


表 1.3 COURSE 课程 表 





课程 名 称 课程 编号 学 分 所 在 系 
计算 机 入 门 CS1310 4 计算 机 科学 
数据 结构 CS3320 4 计算 机 科学 
离散 数学 MATH2410 3 数学 

数据 库 CS3380 3 计算 机 科学 











表 1.4 SECTION 学 期 表 





学 期 编号 课程 编号 学 期 学 年 教师 姓名 
85 MATH2410 秋季 98 李 小 维 
92 CS1310 秋季 98 何 靖宇 
102 CS3320 春季 99 王 斌 
1 MATH2410 秋季 99 郑 宏 
119 CS1310 秋季 99 何 靖宇 


135 CS3380 秋季 99 谭 伟 























102 
135 


表 1.5 GRADE_ REPORT 成 绩 表 表 1.6 PREREQUESIT 先 修 课程 表 
学 号 学 期 编号 | 成 绩 等 级 课程 编号 先 修 课 程 编号 
17 112 B CS3380 CS3320 
17 119 区 
CS3380 MATH2410 
85 A 
92 n CS3320 CS1310 
B 
A 





STUDENT 学 生 表 包 含 姓名 ,学 号 .班级 及 专业 。 

COURSE 课程 表 包 含 课程 名 称 ,课程 编号 、 学 分 及 所 在 系 。 

SECTION 学 期 表 包 含 学 期 编号 .课程 编号 ,学 期 ,学 年 及 教师 姓名 。 

GRADE_REPORT 成 绩 表 包含 学 号 .学 期 编号 及 成 绩 等 级 。 

PREREQUESIT 先 修 课程 表 包 含 课程 编号 及 先 修 课程 编号 。 

根据 以 上 给 出 的 信息 可 以 得 出 任何 一 个 学 生 每 门 课 的 成 绩 ,也 可 以 获取 任何 一 个 教 
师 每 个 学 期 所 教 的 课程 。 对 于 这 样 一 个 数据 库 的 建立 ,应 该 考虑 所 要 存储 的 数据 内 容 , 数 
据 的 格式 数据 之 间 的 联系 、 数 据 的 安全 等 ,这 些 都 是 建立 数据 库 时 应 该 考虑 的 内 容 。 用 
户 可 以 使 用 数据 的 查询 ,数据 的 增加 数据 的 删除 等 功能 ,而 实现 这 些 功 能 需要 数据 库 管 
理 系统 的 参与 。 例 如 ,需要 考虑 学 生 表 应 该 包含 哪些 数据 项 信息 、 每 个 数据 项 的 类 型 ,可 
以 对 学 生 表 添 加 新 的 学 生 信 息 、 修 改 学 生 信 息 、 删 除 学 生 信 息 以 及 查询 学 生 信息 ;要 求学 
生 的 成 绩 必 须 控 制 在 一 定 的 范围 ,并 确定 只 有 教师 才 可 以 修改 学 生 的 成 绩 , 而 学 生 只 能 查 
看 成 绩 ; 还 可 以 对 这 些 信息 进行 备份 ,在 系统 崩溃 的 情况 下 ,数据 受到 破坏 时 第 一 时 间 恢 
复 到 正常 状态 ,所 有 这 些 操作 都 需要 在 DBMS 中 完成 。 


1.2 逻辑 数据 模型 


数据 模型 (data model) 是 用 来 描述 数据 ,组 织 数据 和 对 数据 进行 操作 的 模型 。 本 节 
所 讲 的 数据 模型 特 指 逻 辑 数据 模型 , 它 是 数据 库 系 统 的 基础 。 各 种 DBMS 软件 都 是 基于 
某 种 数据 模型 的 。 因 此 ,了 解数 据 模型 的 概念 非常 必要 。 

数据 模型 是 数据 和 信息 的 一 种 表示 法 ,实际 上 是 数据 在 数据 库 中 的 存储 结构 。 一 般 
从 静态 特性 和 动态 特性 两 个 方面 描述 数据 模型 。 数 据 模型 通常 由 数据 结构 、 数 据 操作 和 
数据 完整 性 约束 三 部 分 组 成 。 其 中 ,数据 结构 和 数据 完整 性 约束 描述 的 是 静态 特性 ,数据 
操作 描述 的 是 动态 特性 。 

数据 结构 ,描述 数据 库 的 组 成 对 象 以 及 对 象 之 间 的 联系 。 它 描述 两 类 内 容 : 一 类 是 描述 
对 象 的 类 型 .内 容 和 性 质 ; 另 一 类 是 描述 数据 之 间 的 联系 。 这 些 都 属于 数据 模型 的 静态 特性 。 

数据 操作 , 指 在 数据 对 象 上 进行 的 任何 操作 ,主要 有 增加 、 删 除 、 修 改 、 查 询 。 这 些 数 
据 操作 属于 数据 模型 的 动态 特性 。 数 据 模型 中 必须 定义 这 些 操作 的 确切 含义 、 操 作 符号 、 
操作 规则 及 实现 操作 的 语言 。 

数据 完整 性 约束 ,是 一 组 完整 性 规则 。 完 整 性 规则 是 对 给 定 的 数据 模型 中 的 数据 及 
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其 联系 的 制约 ,以 保证 数据 正确 ,有 效 、 相 容 。 

由 于 数据 结构 是 刻画 一 个 数据 模型 性 质 最 重要 的 方面 ,所 以 人 们 常常 按照 数据 结构 
的 类 型 来 命名 数据 模型 。 数 据 模型 依据 数据 结构 的 类 型 主要 分 为 层次 模型 .网 状 模型 关 
系 模型 面向 对 象 模型 半 结 构 化 数据 模型 等 ,本 章 只 介绍 层次 模型 .网 状 模 型 .关系 模型 。 


1.2.1 层次 模型 


层次 模型 是 最 早出 现 的 数据 模型 。 基 于 层次 模型 的 数据 库 叫 作 层 次 数据 库 , 典 型 的 
代表 是 IBM 公司 的 信息 管理 系统 (Information Management System,IMS) ,曾经 得 到 广 
泛 的 使 用 。 


1. 层次 模型 的 数据 结构 


层次 模型 以 一 个 倒立 的 树 结构 表示 各 对 象 及 对 象 间 的 联系 。 因 为 现实 世界 中 许多 对 
象 之 间 的 联系 呈现 出 一 种 层次 关系 。 每 个 结 点 表示 一 个 记录 类 型 , 结 点 之 间 的 联系 表示 
记录 类 型 之 间 的 联系 。 每 个 记录 类 型 可 以 包括 若干 字段 。 层 次 模型 的 结构 特点 如 下 。 

(1) 每 个 子 结 点 只 有 一 个 双亲 结 点 ,而 且 只 有 根 结 点 没有 双亲 结 点 。 

(2) 查询 任何 一 个 给 定 的 记录 时 ,只 有 按 其 路 径 查看 ,才能 显示 出 它 的 全 部 含义 , 没 
有 一 个 子 记录 可 以 脱离 双亲 记录 而 存在 。 

(3) 层次 数据 库 系 统 只 能 处 理 一 对 多 的 联系 。 

图 1. 5 给 出 一 个 层次 模型 的 实例 。 


学 院 学 院 编 号 | 学 院 名 | 院 长 


| 


系 系 号 系 名 ”| 系 主任 名 















































教研 室 | | 学 生 
室 号 | 室 名 |[ 室 主 任 名 学 号 | 姓名 | 性别 | 专业 | 入 学 年 从 
教员 | 
姓名 | 年龄 | 职称 | 办公室 | 专长 














图 1.5 学 校 层次 模型 实例 


该 层次 模型 由 学 院 , 系 ` 教 研 室 , 学 生 教员 构成 ,学 院 是 根 结 点 , 结 点 学 生 和 结 点 教研 
室 是 结 点 系 的 子 结 点 , 结 点 教研 室 是 结 点 教员 的 双亲 结 点 。 学 院 由 多 个 系 组 成 , 系 由 教研 
室 和 学 生 构成 ,教研 室 下 面 有 多 个 教员 。 


2. 层次 模型 的 操作 和 完整 性 约束 


层次 模型 的 数据 操作 主要 有 增加 、 删 除 、 修 改 、 查 询 。 对 层次 模型 进行 相应 操作 时 , 需 
要 满足 它 的 完整 性 约束 条 件 。 
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进行 插入 操作 时 ,如 果 没 有 相应 的 双亲 结 点 ,就 不 能 插入 它 的 子女 结 点 。 例 如 ,新 调 
来 一 名 教师 ,如 果 没 有 给 他 分 配 教研 室 ,就 不 能 将 其 值 插入 到 数据 库 中 。 

进行 删除 操作 时 ,如 果 删 除 的 是 双亲 结 点 , 则 相应 的 子女 结 点 值 也 将 被 同时 删除 。 例 
如 ,删除 某 个 教研 室 , 则 其 下 的 教师 信息 将 全 部 被 删除 。 


3. 层次 模型 的 优 缺点 


层次 模型 能 得 到 广泛 使 用 主要 因为 它 本 身 存在 很 多 优点 。 层 次 模型 的 优点 主要 如 下 。 

(1) 层次 模型 的 数据 结构 比较 简单 。 

(2) 层次 数据 库 的 查询 效率 高 。 层 次 模型 的 记录 之 间 的 联系 用 指针 来 实现 , 当 要 存 
取 某 个 结 点 的 值 时 ,只 需要 沿 着 指针 所 示 的 路 径 进 行 寻 找 , 就 可 以 很 快 找到 。 

(3) 层次 模型 提供 良好 的 完整 性 支持 。 

层次 模型 被 其 他 数据 模型 取代 ,其 原因 主要 如 下 。 

(1) 现实 世界 中 有 很 多 非 层 次 的 联系 。 此 外 ,多 对 多 的 联系 .一 个 结 点 有 多 个 双亲 结 
点 等 ,这 些 情 况 都 无 法 用 层次 模型 实现 。 

(2) 查询 子女 结 点 必须 通过 双亲 结 点 。 

(3) 对 插入 和 删除 操作 的 限制 比较 多 。 


1.2.2 网 状 模型 


现实 世界 中 ,事物 之 间 的 联系 更 多 的 是 非 层次 关系 。 美 国 CODASYL (Conference 
on Data System Language) 下 属 的 DBTG(Data Base Task Group) 于 1971 年 4 月 发 表 了 
名 为 《1971 年 DBTG 报告 ) 的 数据 库 建议 书 ,给 出 了 网 状 数据 库 系统 的 方案 ,为 网 状 数据 
库 提供 了 完整 的 系统 设计 和 语言 规范 。 


1. 网 状 模 型 的 数据 结构 


网 状 模型 是 一 种 比 层次 模型 更 具有 普遍 性 的 模型 , 即 用 图 (Graph) 结 构 表示 对 象 以 
及 对 象 之 间 的 联系 。 它 的 结构 特点 如 下 。 

(1) 允许 一 个 以 上 的 结 点 无 双亲 。 

(2) 一 个 结 点 可 以 有 多 于 一 个 的 双亲 。 

网 状 模型 比 层 次 模型 更 具 普 遍 性 的 结构 ,因此 它 可 以 更 直接 地 描述 现实 世界 。 而 层 
次 模型 实质 上 是 网 状 模型 的 特例 。 与 层次 模型 一 样 ,网 状 模型 中 的 每 个 结 点 表示 一 个 记 
录 类 型 ,每 个 记录 类 型 可 包含 若干 字段 , 结 点 间 的 连 线 表示 记录 之 间 的 联系 。 

图 1.6 给 出 了 一 个 网 状 模 型 的 例子 。 一 个 系 可 以 有 多 个 教师 .学 生 、 专 业 ; 一 个 教师 
属于 某 一 个 系 、 教 若干 学 生 、 任 教 某 个 专业 ;一 个 学 生 属 于 某 个 系 、 由 某 些 老师 教 , 学 某 个 
专业 ;一 个 专业 被 设 在 某 个 系 、 由 某 些 教师 任教 ,被 某 些 学 生 选 修 ,它们 之 间 构 成 了 一 个 复 
杂 的 网 状 结构 。 

网 状 模型 没有 层次 模型 那样 严格 的 完整 性 约束 条 件 ,但 提供 了 定义 网 状 数据 库 完整 
性 的 若干 概念 和 语句 。 
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图 1.6 学 校 网 状 模型 实例 


2. 网 状 模型 的 优 缺点 


网 状 模型 的 优点 主要 如 下 。 

(1) 可 以 更 直接 地 描述 现实 世界 。 

(2) 具有 良好 的 性 能 , 存 取 效 率 高 。 

网 状 模 型 的 缺点 主要 是 数据 结构 复杂 实现 起 来 比较 困难 。 


1.2.3 关系 模型 


1970 年 ,美国 IBM 公司 的 E.F. Codd 首次 提出 了 关系 模型 ,并 因此 获得 了 ACM 图 灵 奖 。 

关系 数据 模型 是 目前 使 用 最 广泛 的 一 种 数据 模型 ,现在 的 数据 库 产品 大 部 分 都 以 关 
系数 据 模型 为 基础 。 它 采用 关系 作为 旭 辑 结构 ,实际 上 关系 就 是 一 张 二 维 表 ,一 般 简 称 
表 , 如 图 1.7 所 示 。 





图 1.7 二 维 表 


关系 模型 作为 应 用 最 广泛 的 数据 模型 ,有 如 下 优点 。 

(1) 关系 数据 模型 简单 。 它 的 基本 结构 是 二 维 表 ,数据 表示 方法 简单 、 清 晰 ,容易 在 
计算 机 上 实现 。 

(2) 关系 模型 是 3 种 多 辑 数据 模型 中 唯一 有 数学 理论 作 基 础 的 模型 , 它 的 定义 及 操 
作 有 严格 的 数学 理论 基础 。 

(3) 关系 模型 的 存 取 路 径 对 用 户 透 明 ,因而 具有 更 强 的 独立 性 。 


1.3 ”数据 库 系统 的 结构 


数据 库 系统 的 结构 从 不 同 的 人 员 角 度 看 ,有 不 同 的 划分 方式 。 从 数据 库 应 用 开发 人 
员 角 度 看 ,数据 库 系 统 通常 采用 三 级 模式 结构 , 即 外 模式 、 模 式 、 内 模式 。 这 是 数据 库 系统 
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内 部 的 体系 结构 。 从 数据 库 的 最 终 用 户 角度 看 ,数据库 系统 结构 分 为 单 用 户 结构 、 集 中 式 
结构 ,分布 式 结构 、 主 从 式 结构 、C/S( 客 户 / 服 务 器 ) 结 构 、B/S( 浏 览 器 /服务 器 ) 结 构 等 。 
这 是 数据 库 系 统 外 部 的 体系 结构 。 


1.3.1 模式 及 实例 的 概念 


在 数据 模型 中 有 "型 2 和”* 值 ?的 概念 。 型 是 指 某 一 类 数据 的 结构 和 属性 说 明 。 值 是 型 
的 一 个 具体 意义 。 例 如 ,教师 记录 定义 为 ( 教 职 工 号 ,姓名 ,性别 , 职称, 专业 ) ,而 
(20171001, 李 宏 , 男 ,教授 ,大 数据 ) 则 是 该 记录 的 一 个 值 。 

模式 (schema) 是 数据 库 中 全 体 数据 的 逻辑 结构 和 特征 的 描述 , 它 仅 涉及 型 的 描述 ， 
某 种 具体 状态 下 的 值 则 称 为 一 个 实例 (instance)。 同 一 个 模式 有 很 多 个 值 , 即 多 个 实例 。 
例如 ,在 学 生 选 课 数 据 库 模 式 中 包含 学 生 记录 ,课程 记录 和 学 生 选 课 记录 。 该 实例 包含 了 
2016 年 学 校 所 有 的 学 生 记 录 、 课 程 记录 和 选课 记录 ,那么 ,2017 年 度 学 校 的 所 有 学 生 记 
录 、 课 程 记录 和 选课 记录 就 是 另外 一 个 实例 。 模 式 是 相对 稳定 的 ,而 实例 是 相对 变动 的 ， 
因为 模式 里 的 值 可 能 是 不 断 变化 的 。 





1.3.2 数据 库 系 统 的 三 级 模式 结构 


不 管 是 数据 模型 数据库 语言 ,操作 系统 ,还 是 存储 结构 ,数据 库 系 统 的 结构 一 般 都 由 
三 级 模式 构成 。 图 1. 8 所 示 为 数据 库 系统 的 三 级 模式 结构 , 它 由 内 模式 、 模 式 、 外 模式 和 
两 级 映像 构成 。 
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图 1.8 数据 库 系统 的 三 级 模式 结构 
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1. 内 模式 


内 模式 也 称 为 存储 模式 , 它 是 数据 物理 结构 和 存储 方式 的 描述 ,是 数据 在 数据 库 内 部 的 
组 织 方式 ,是 对 数据 的 存储 结构 、 存 取 方 法 ,存储 路 径 的 描述 。 一 个 数据 库 只 有 一 个 内 模式 。 
例如 ,数据 在 数据 库 内 部 是 按 堆 存储 、 按 Hash 方法 存储 、 按 索引 存储 还 是 按 某 个 值 的 升序 
或 降序 存储 ,是 否 加 密 存 储 ,是 否 压缩 存储 ,以 及 数据 的 存储 记录 结构 是 定 长 还 是 变 长 等 。 
在 学 生 选 课 数据 库 中 ,学 生 表 的 存储 结构 是 否 按 堆 存储 ,要 考虑 是 否 在 学 号 上 建立 索引 等 。 


2. 模式 


模式 也 称 概 念 模式 和 逻辑 模式 ,是 数据 库 中 全 体 数 据 的 逻辑 结构 和 特征 的 描述 ,是 所 
有 用 户 公 用 的 数据 库 收 辑 结 构 。 它 是 数据 库 系统 三 级 模式 结构 的 中 间 层 , 既 不 涉及 数据 
的 物理 存储 细节 ,也 不 涉及 应 用 程序 的 实现 方式 。 一 个 数据 库 只 有 一 个 模式 。 模 式 定义 
数据 的 馆 辑 结构 ,如 记录 名 称 \ 数 据 项 名 称 、 数 据 类 型 长度, 还 包括 数据 的 安全 性 和 完整 
性 以 及 数据 之 间 的 联系 。 例 如 ,在 学 生 选 课 数据 库 中 ,其 模式 包含 学 生 记录 表 student、 学 
生 选 课 记 录 表 sc .课程 记录 表 course, 如 图 1. 9 所 示 。 在 该 数据 库 模 式 中 ,确定 学 生 记 录 
表 是 由 哪些 项 构成 的 ,并 确定 每 项 的 数据 类 型 及 取 值 范围 ; 同 理 , 也 需 对 学 生 选 课 记 录 表 
及 课程 记录 表 进 行 定义 。 又 如 , 某 公司 的 数据 库 模 式 包含 职工 记录 表 employee、 部 门 记 
录 表 department、 部 门 地 址 记录 表 dept_locations、 项 目 记 录 表 project、 员 工 参 与 项 目 记 录 
表 works_on 和 员工 家 属 记录 表 dependent, 如 图 1. 10 所 示 。 
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sno sname SSEX Sage sdept | 
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cno cname cpno ccredit 
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Sno cno grade 





图 1.9 学 生 选 课 数 据 库 模式 
数据 库 管理 系统 提供 模式 数据 定义 语言 来 严格 定义 模式 。 
3. 外 模式 


外 模式 也 称 子 模式 或 者 用 户 模式 , 它 是 数据 库 用 户 能 够 看 见 和 使 用 的 局 部 数据 的 边 
辑 结 构 和 特征 描述 ,是 数据 库 用 户 的 数据 视图 .是 与 某 一 应 用 有 关 的 数据 的 逻辑 表示 。 由 
于 用 户 的 需求 等 因素 不 同 ,一 个 数据 库 可 以 有 多 个 外 模式 ,每 个 用 户 通过 一 个 外 模式 使 用 
数据 库 ,不 同 的 用 户 可 以 使 用 同一 个 外 模式 。 外 模式 主要 描述 用 户 视图 的 各 记录 组 成 . 相 
互联 系数 据 项 特征 数据 安全 性 和 完整 性 约束 条 件 等 。 例 如 ,在 学 生 选 课 数据 库 中 ,学 生 
用 户 视 图 和 教师 用 户 视图 不 同 ,如 图 1. 11 所 示 ,学生 用 户 要 查询 自己 的 成 绩 , 所 能 看 到 的 
外 模式 为 s_grade(snoysname,cno,vcname,grade) ;教师 用 户 要 查看 哪些 同学 选 了 自己 的 
课程 ,所 能 看 见 的 外 模式 为 t_course(sno,sname)。 
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employee 
name ssn bdate address SSeX Salary superssn dno 
department | dname dnumber mgrssn mgrstartdate 
dept_locations dnumber | dlocation 
project 
pname pnumber | plocation dnum 
works_on esSn pno hours 
dependent 





essn dependent_name | SSeX | bdate | relationship 


1.10 公司 数据 库 模 式 
























































教师 外 模式 t_course 学 生 外 模式 s_grade 

sno | sname | sno [sname| cno | cname | grade 

0l | tom | 01 tom | 01 | 数学 85 

02 | luey | 01 | tom | 02 | 数据库 | 78 

cno | cname | grade 
[_sno | sname | sex age | sdept Sno cno | grade 1 数学 4 
| 0L | tom | 了 18 cs ol 01 85 2 | 数据库 | 3 模式 
02 lue m 19 math 01 02 78 



































1.11 学 生 选 课 数据 库 模式 及 外 模式 
数据 库 管 理 系统 提供 外 模式 数据 定义 语言 来 严格 定义 外 模式 。 
4. 两 级 映像 ( 射 ) 


1) 外 模式 /模式 映像 

外 模式 /模式 映像 定义 了 外 模式 与 模式 之 间 的 映像 关系 。 一 个 模式 可 以 有 很 多 个 外 
模式 ,而 每 个 外 模式 都 有 一 个 外 模式 /模式 映像 , 它 定 义 了 该 外 模式 与 模式 之 间 的 对 应 关 
系 , 这 些 映像 定义 通常 在 各 自 外 模式 的 描述 中 。 当 模式 改变 时 ,如 增加 新 的 属性 、 改 变 属 
性 的 数据 类 型 .增加 新 的 关系 等 ,外 模式 不 需要 改变 ,只 需要 修改 其 外 模式 /模式 映射 ,不 
用 修改 对 应 的 应 用 程序 ,保证 了 数据 与 程序 的 逻辑 独立 性 , 称 作 数据 的 逻辑 独立 性 。 

2) 内 模式 /模式 映像 

内 模式 /模式 映像 定义 了 模式 与 内 模式 之 间 的 映像 关系 。 因 为 数据 库 中 只 有 一 个 模 
式 及 一 个 内 模式 ,因此 也 只 有 一 个 内 模式 /模式 映像 , 它 定义 了 数据 的 全 局 逻辑 结构 与 存 
储 结构 之 间 的 对 应 关系 。 例 如 , 当 数据 库 的 存储 结构 或 存 取 方 法 发 生 改 变 时 ,不 用 修改 模 
式 , 因 为 只 需要 修改 内 模式 /模式 映像 ,从 而 保证 了 数据 的 物理 独立 性 。 
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在 数据 库 的 三 级 模式 结构 中 ,数据库 模 式 ( 即 全 局 逻辑 结构 ) 是 数据 库 的 中 心 与 关键 。 
设计 数据 库 模 式 结构 时 ,应 首先 确定 数据 库 的 全 局 逻辑 结构 ;设计 合适 的 数据 内 模式 使 得 
所 定义 的 全 局 逻辑 结构 按照 一 定 的 物理 存储 策略 进行 组 织 , 以 达到 较 高 的 时 间 与 空间 效 
率 ;数据 库 的 外 模式 面向 具体 的 应 用 程序 , 当 相 应 的 外 模式 已 经 不 能 满足 视图 要 求 时 ,该 
模式 就 要 做 相应 的 改动 ,应 充分 考虑 应 用 的 扩充 性 。 


1.3.3 数据 库 系统 的 体系 结构 


一 个 数据 库 应 用 系统 中 通常 包括 数据 存储 层 ` 业 务 处 理 层 .界面 表示 层 3 个 层次 。 数 
据 存储 层 负责 对 数据 库 中 数据 的 各 种 操作 ;业务 处 理 层 完成 用 户 的 业务 操作 ,通常 通过 程 
序 语言 编程 实现 ;界面 表示 层 实现 数据 库 应 用 系统 与 用 户 的 交互 。 根 据 这 几 个 层次 在 数 
据 库 应 用 系统 中 的 分 布 位 置 ,数据 库 应 用 系统 的 体系 结构 分 为 集中 式 \ 两 层 客户 /服务 器 、 
三 层 客户 /服务 器 等 结构 。 


1. 集中 式 结构 


在 集中 式 结构 中 ,数据 库 应 用 系统 中 的 数据 存储 层 、 业 务 处 理 层 及 界面 表示 层 都 运 
行 于 单 台 计算 机 上 , 即 应 用 程序 .DBMS、 数 据 都 在 一 台 计 算 机 上 ,所 有 的 处 理 任务 都 由 
这 台 机 器 完成 。 各 个 用 户 可 以 通过 终端 设备 接 入 这 台 计 算 机 (主机 ), 并 发 地 存 取 和 使 
用 数据 库 。 这 台 计 算 机 既 执行 应 用 程序 ,又 执行 DBMS 功能 。 集 中 式 结构 比较 容易 实 
现 , 缺 点 是 当主 机 任务 繁忙 时 ,性 能 急速 下 降 ,而 当主 机 故障 时 ,整个 系统 都 将 陷入 瘫 
痪 状态。 数据 库 应 用 系统 集中 式 结构 如 图 1. 12 所 示 , 它 由 运行 数据 库 的 主机 及 终端 
构成 。 











2. 两 层 客户 /服务 器 结构 


在 两 层 客户 /服务 器 (Browser/Server,C/S) 结 构 中 ,数据 存储 层 和 业务 处 理 层 及 界面 
表示 层 分 别 运行 在 两 台 不 同 的 机 器 上 ,数据 存储 层 运行 于 数据 库 服 务 器 上 ,业务 处 理 层 和 
界面 表示 层 运 行 在 客户 机 上 , 即 存放 了 数据 和 执行 DBMS 功能 的 机 器 叫 作 数据 库 服务 器 
(DB Server) ,而 运行 客户 端 程序 支持 客户 交互 与 应 用 业务 的 机 器 叫 作 客户 机 。 如 图 1. 13 所 














示 , 这 里 的 客户 机 也 可 以 是 浏览 器 , 即 浏览 器 /服务 器 结构 。 














Cu 
客户 机 客户 机 客户 机 
图 1.13 数据 库 应 用 系统 两 层 客户 /服务 器 结构 


在 两 层 客户 /服务 器 结构 中 ,客户 端的 用 户 请 求 通过 网 络 传送 到 数据 库 服 务 器 ,数据 
库 服 务 器 处 理 完 用 户 的 数据 请 求 之 后 将 结果 数据 返回 给 客户 端 ,客户 端 再 将 最 终结 果 呈 
现 给 用 户 。 


3. 三 层 客 户 / 服 务 器 结构 


在 三 层 客户 /服务 器 结构 中 ,数据 存储 层 `, 业 务 处 理 层 及 界面 表示 层 分 别 运行 在 三 台 
不 同 的 机 器 上 ,运行 数据 存储 层 的 机 器 叫 作 数据 库 服务 器 ,运行 业务 处 理 层 的 机 器 叫 作 应 
用 服务 器 ,与 用 户 交 互 的 界面 表示 层 为 客户 端 , 即 存放 了 数据 和 执行 DBMS 功能 的 机 器 
叫 作 数据 库 服务 器 ,而 运行 应 用 程序 的 机 器 叫 作 应 用 服务 器 ,运行 客户 端 程序 的 叫 作客 户 
端 。 数 据 库 应 用 系统 三 层 客户 /服务 器 结构 如 图 1. 14 所 示 。 


国 互联 网 /局 域 网 -| 


数据 库 服务 器 
客户 端 应 用 服务 器 
1.14 数据 库 应 用 系统 三 层 客户 /服务 器 结构 


在 该 结构 中 ,客户 端的 用 户 请 求 通过 网 络 首先 被 发 送 给 应 用 服务 器 ,应 用 服务 器 执行 
相应 的 业务 处 理 ,如 果 有 数据 请 求 , 则 请 求 被 传送 到 数据 库 服务 器 ,数据 库 服务 器 进行 处 
理 后 将 结果 通过 应 用 服务 器 返回 给 用 户 。 


1.4 数据 管理 技术 的 发 展 历史 


数据 管理 是 指 对 数据 的 组 织 分类、 加 工 、 存 储 、 检 索 和 维护 。 随 着 计算 机 软 硬 件 技术 
的 发 展 , 数 据 量 的 剧 增 、 人 们 需求 的 提高 ,数据 管理 技术 的 发 展 经 历 了 人 工 管理 阶段 ,文件 
系统 管理 阶段 和 数据 库 管理 系统 阶段 。 
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1.4.1 人 工 管理 阶段 


20 世纪 50 年 代 , 计 算 机 主要 用 于 科学 计算 。 计 算 机 没有 完善 的 操作 系统 ;外 部 存储 
器 只 有 了 磁带、 穿孔 卡片 等 ,没有 磁盘 ,没有 专门 管理 数据 的 软件 ,数据 不 保存 在 计算 机 内 ; 
当时 只 有 程序 ,一 组 数据 对 应 于 一 个 应 用 程序 ,如 图 1. 15 所 示 ,数据 存在 着 大 量 数据 宛 余 
的 现象 ,并 且 对 数据 的 管理 只 能 依赖 人 工 完成 ,需要 数据 时 将 数据 输入 ,用 完 后 退出 ,不 能 

















长 期 保存 数据 。 
应 用 程序 1 | 数据 集 1 
应 用 程序 2 PP “| 数据 集 2 
应 用 程序 ”上 一 一 一 一 一 一 数据 集 n 











图 1.15 人 工 管理 阶段 应 用 程序 处 理 数据 


1.4.2 文件 系统 管理 阶段 


20 世纪 50 年 代 后 期 到 60 年 代 中 期 ,计算 机 技术 有 了 很 大 的 发 展 ,计算 机 硬件 方面 
出 现 了 可 以 直接 存 取 的 外 部 存储 设备 磁盘 ,而 软件 方面 有 了 操作 系统 ,并 且 其 中 包含 专门 
管理 数据 的 文件 系统 , 随 着 数据 量 大 大 增加 ,为 便于 对 数据 进行 管理 ,数据 的 管理 以 独立 
的 文件 形式 存放 ,并 可 按 记录 存 取 。 图 1. 16 描述 了 某 销售 公司 的 3 个 文件 处 理 系统 , 包 
括 订单 填写 系统 、 开 发 票 系统 、 工 资 单 系统 。 图 中 还 显示 了 与 每 个 应 用 关联 的 主要 数据 文 
件 。 其 中 ,开发 票 系统 有 2 个 文件 : 顾客 管理 文件 和 存货 价格 文件 。 
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区 作 文 作 文 作 习作 人 文件 

图 1.16 某 销售 公司 的 3 个 文件 处 理 系统 


文件 系统 管理 阶段 ,应 用 程序 和 数据 之 间 有 了 一 定 的 独立 性 ,程序 员 不 必 过 多 地 考虑 














物理 细节 ,可 以 将 精力 放 在 算法 上 ;并且 数据 可 以 长 期 保存 在 存储 设备 上 供用 户 使 用 ,如 


图 1.17 所 示 。 
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应 用 程序 2 (zw ) 数据 集 2 
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图 1.17 文件 系统 管理 阶段 应 用 程序 处 理 数据 


文件 系统 管理 阶段 ,用 户 可 以 反复 对 文件 进行 查询 ,修改 ,插入 和 删除 等 操作 。 人 们 
编写 不 同 的 应 用 程序 ,从 相应 的 文件 中 读 取 记录 或 写 入 记录 到 相应 的 文件 中 。 下 面 的 两 
个 例子 分 别 展 示 了 文件 系统 管理 阶段 如 何 向 文件 写 入 数据 ,以 及 如 何 从 文件 中 读 出 数据 。 


【 例 1.1] 
如 下 : 


#include "stdio.h" 

main() 

{ file * fp; 
fp=fopen ("filel.c", "w"); 
fputs ("chenwei ", fp); 
putw (20000101, fp); 
putw (20, fp); 
fputs ("Linzi ", fp); 
putw (20000102, fp); 
putw (21, fp); 
fclose (fp); 

} 


【 例 1.2】 在 C 语 言 中 显示 文件 中 的 数据 ,可 使 用 如 下 程序 : 


#include "stdio.h" 
#define size 2 
struct student type 
{ char name[8]; 

int num; 

int age; 

}stud[size]; 
main() 
{ 

int i; 


file * fp; 


在 C 语 言 中 ,将 两 个 学 生 的 姓名 、 学 号 年龄 输入 到 一 个 文件 中 ,程序 清单 
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fp= fopen ("filel.c","r"); 

for (i=0;i< size;i++) 
| 

fread (&stud[i], sizeof (struct student type),1,fp); 

printf ("%8s %8d %4d\n", stud[i] .name, stud[i] .num, stud[i].age); 
} 


从 以 上 两 个 程序 清单 可 以 看 出 ,文件 系统 管理 阶段 对 数据 的 处 理 非常 不 灵活 ,一旦 读 
取 或 者 写 人 的 数据 结构 发 生变 化 ,程序 就 需要 重新 编写 。 

虽然 在 文件 系统 管理 阶段 ,一 个 应 用 程序 可 以 处 理 多 个 数据 文件 ,但 是 一 个 文件 基本 
上 对 应 一 个 应 用 程序 , 当 不 同 的 应 用 程序 具有 相同 的 数据 时 ,不 能 共享 其 中 相同 的 数据 ， 
造成 数据 宛 余 度 大 ,从 而 造成 数据 的 不 一 致 性 ,并 给 数据 的 维护 造成 困难 。 并 且 文 件 与 文 
件 之 间 是 相互 孤立 的 ,它们 的 联系 只 能 通过 应 用 程序 来 实现 。 例 如 ,在 图 1. 16 中 ,订单 填 
写 系统 与 开发 票 系统 都 需要 读 取 顾客 文件 ,但 却 不 是 同一 个 数据 文件 ,而 是 其 不 同 的 副 
本 。 并 且 订单 填写 系统 中 的 存货 管理 文件 内 容 包 含 了 开发 票 系统 中 的 存货 价格 文件 内 
容 , 也 造成 了 数据 元 余 。 

在 文件 系统 管理 阶段 ,很 难 控制 某 个 人 对 文件 的 操作 ,例如 ,用 户 A 只 可 以 读 取 文 
件 ,而 不 可 以 修改 文件 ;而 用 户 B 既 可 以 读 取 文件 ,又 可 以 修改 文件 。 实 际 应 用 中 就 有 很 
多 类 似 这 样 的 情况 ,例如 ,对 于 学 生成 绩 管理 系统 ,学 生 只 可 以 查询 成 绩 , 而 老师 才 可 以 录 
人 成 绩 。 文 件 系统 管理 阶段 无 法 实现 对 数据 的 安全 性 管理 。 

在 文件 系统 管理 阶段 , 当 多 个 用 户 同时 访问 某 个 文件 时 ,也 无 法 进行 并 发 管理 ,从 而 
导致 混乱 。 例 如 ,用 户 A 修改 一 个 文件 的 同时 ,用 户 BB 需要 读 取 该 文件 。 


1.4.3 数据 库 管 理 系 统 阶 段 


20 世纪 60 年 代 后 期 ,数据 管理 中 的 数据 量 剧 增 , 硬 件 出 现 了 大 容量 的 磁盘 ,价格 下 
降 , 为 了 克服 文件 管理 系统 阶段 的 弊病 ,解决 多 用 户 、 多 应 用 共享 数据 的 需求 ,使 数据 为 尽 
可 能 多 的 应 用 服务 ,出 现 了 专门 管理 数据 的 软件 ,进入 了 数据 库 管理 系统 管理 数据 时 代 。 

如 图 1. 18 所 示 ,数据 统一 由 数据 库 管 理 系统 管理 和 控制 ,应 用 程序 通过 数据 库 管 理 
系统 共享 数据 库 中 的 数据 。 在 这 个 阶段 ,数据 从 应 用 程序 中 分 离 出 来 ,提高 了 数据 的 共享 
性 ,使 得 多 个 用 户 可 以 共享 数据 库 ,数据 库 中 的 数据 被 多 个 应 用 共享 访问 ,降低 了 数据 的 
元 余 度 ,提高 了 数据 的 一 致 性 。 
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这 一 阶段 实现 了 数据 多 级 别 的 安全 性 管理 、 多 用 户 同 时 访问 数据 的 并 发 控制 以 及 灾 
难 发 生 时 的 恢复 机 制 。 同 时 ,数据 库 中 的 数据 是 按照 一 定 的 数据 模型 (逻辑 数据 模型 ) 组 
织 ,描述 和 存储 的 ,通常 称 为 数据 结构 化 。 

数据 模型 是 数据 库 管理 系 统 的 基础 , 它 表示 现实 世界 中 各 种 数据 对 象 和 数据 间 的 联 
系 。 经 过 50 多 年 的 时 间 ,依据 数据 模型 的 发 展 ,数据 库 可 以 分 为 4 个 发 展 阶段 : 层次 数 
据 库 管理 系统 阶段 ;网 状 数据 库 管理 系统 阶段 ;关系 数据 库 管理 系统 阶段 ;新 一 代数 据 库 
管理 系统 阶段 。 


1. 层次 数据 库 管 理 系统 阶段 


1969 年 由 IBM 公司 研制 的 层次 数据 库 管 理 系统 IMS 是 基于 层次 数据 模型 , 它 是 
IBM 公司 推出 的 一 个 大 型 的 商用 数据 库 管理 系统 , 曾 在 20 世纪 70 年 代 到 80 年 代 早期 得 
到 广泛 使 用 。 


2. 网 状 数据 库 管理 系统 阶段 


网 状 数据 库 管理 系统 是 基于 网 状 数据 模型 。 其 典型 代表 是 DBTG 系统 ,也 称 为 
CODASYL 系统 , 它 是 20 世纪 70 年 代 由 数据 系统 语言 研究 会 (Conference On Data 
System Language,CODASYL) 下 属 的 数据 库 任务 组 (Data Base Task Group,DBTG ) 提 
出 的 一 个 系统 方案 , 它 不 是 一 个 实际 的 数据 库 系 统 软件 ,只 是 一 个 模型 。20 世纪 70 年 代 
中 期 ,不 少 公司 都 采用 此 模型 构建 自己 的 数据 库 管理 系统 ,其 中 最 典型 的 如 Cullinet 软件 
公司 的 IDMS .HP 公司 的 IMAGE 、Honeywell 公司 的 IDS/2 等 。 


3. 关系 数据 库 管 理 系统 阶段 


关系 型 数据 库 管 理 系统 是 基于 关系 数据 模型 。 该 模型 由 IBM 公司 的 San Jose 研究 
室 的 研究 员 E. F. Codd 提出 。1976 年 ,IBM 公司 的 System R 和 美国 加 州 大 学 Berkeley 
分 校 的 Ingres 关系 数据 库 系统 是 典型 的 代表 。 在 此 基础 上 ,IBM 公司 推出 了 DB2 商用 
关系 数据 库 系统 ,INGRES 公司 推出 了 Ingres,ORACLE 公司 推出 了 Oracle 等 。20 世纪 
80 年 代 以 来 ,几乎 所 有 的 数据 库 管理 系统 都 支持 关系 数据 模型 ,直到 现在 ,RDBMS 仍然 
是 主流 数据 库 管理 系统 ,占有 大 部 分 市 场 。 

关系 型 数据 库 管 理 系统 具有 模型 简单 清晰 、 严 格 的 数学 理论 基础 ,数据 独立 性 强 、 数 
据 库 语 言 非 过 程 化 ,标准 化 的 特色 。 


4. 新 一 代数 据 库 管理 系统 阶段 


20 世纪 80 年 代 后 期 ,人 们 又 提出 了 新 一 代数 据 库 的 设想 。 新 一 代 的 数据 库 管 理 系 
统 以 更 丰富 多 样 的 数据 模型 和 数据 管理 功能 为 特征 ,满足 广泛 复杂 的 新 应 用 的 要 求 , 它 的 
研究 和 发 展 呈 现 百花 齐 放 的 局 面 , 如 基于 面向 对 象 的 数据 模型 .基于 对 象 关系 的 数据 模 
型 .基于 半 结 构 化 XML 的 数据 模型 .基于 NoSQL 模型 .基于 NewSQL 模型 等 。 新 一 代 
数据 库 管 理 系统 必须 保持 和 继承 第 三 代数 据 库 系 统 技术 ,而 且 还 支持 更 加 丰富 的 对 象 结 
构 .数据 类 型 和 规则 。 
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“1.5 DBMS 组 成 


DBMS 是 一 个 功能 强大 的 软件 系统 , 它 的 组 成 比较 复杂 ,不 同 的 DBMS 产品 结构 差 
别 非常 大 。 图 1. 19 给 出 了 一 个 简化 DBMS 的 组 成 结构 。 



















































































































DBA 用 户 应 用 程序 员 
1 1 
DDL 语 句 交互 式 查询 应 用 查询 
1 1 1 
DDL 编 译 器 A 查询 编译 器 预 编译 器 
到 1 
/ __- 政 DML 编译 器 
pe ee 
7 有 
> a | 可 扣 认 运行 时 处 理 名 
pu rr 存储 数据 管理 器 
系统 目录 / 、 查 ; 、 
i 一 | 完 天 性 管理 等 碰 盘 管理 /级 存 管理 
并 发 控制 /备份 、 
系统 恢复 
数据 库存 信 








图 1.19 DBMS 的 组 成 结构 


DBMS 由 DDL 编译 器 .DML 编译 器 、 查 询 优化 器 ,数据 库 运 行 时 处 理 器 、 存 储 数据 
管理 器 等 组 成 。DDL 语句 经 编译 后 对 数据 库 模 式 所 做 的 修改 都 需要 保存 到 数据 库 的 元 
数据 ( 即 系统 目录 和 数据 字典 ) 中 ;语法 正确 的 查询 语句 及 DML 语句 经 过 编译 后 ,首先 检 
查 用 户 是 否 有 操作 权限 ,通过 存储 数据 管理 器 调用 系统 目录 及 数据 字典 获取 相关 元 数据 
信息 ,并 调用 查询 优化 器 进行 优化 ,选择 最 合适 的 执行 计划 ,再 去 磁盘 上 获取 或 者 写 和 人 最 
终 数 据 。 其 中 ,存储 数据 管理 器 主要 包括 磁盘 管理 器 缓存 管理 器 两 部 分 ,通过 磁盘 管理 
器 访问 和 读 写 磁盘 数据 ,有 些 DBMS 自 带 了 存储 数据 管理 器 ,有 些 DBMS 调用 操作 系统 
的 存储 数据 管理 器 。 数 据 库 由 元 数据 和 数据 构成 ,所 有 的 信息 都 写 在 磁盘 的 数据 文件 和 
日 志文 件 上 。 数 据 库 运 行 时 处 理 器 主要 由 事务 管理 .授权 管理 .完整 性 管理 等 构成 。 


1.6 小 结 


本 章 通过 生活 中 无 处 不 在 的 数据 库 示 例 说 明 数 据 库 的 重要 性 ,给 出 有 关 数 据 库 的 几 
个 基本 概念 ,主要 包括 数据 数据库、 数据 库 系统 、 数 据 库 管理 系统 及 数据 库 的 几 类 用 户 ， 














并 详细 阐述 了 数据 库 管理 系统 的 功能 。 本 章 以 一 个 具体 的 数据 库 例 子 来 讲述 数据库? 这 
门 课程 涉及 的 专业 知识 。 

本 章 的 难点 知识 集中 在 后 面 几 节 , 包 括 数据 模型 的 概念 、 数 据 库 系 统 的 三 级 模式 结 
构 ,数据库 应 用 系统 的 体系 架构 数据库 系统 的 模块 组 成 。 本 章 从 数据 结构 、 数 据 操作 及 
完整 性 约束 三 方面 介绍 了 层次 模型 .网 状 模型 .关系 模型 ;详细 说 明了 数据 库 系统 三 级 模 
式 结构 的 理论 , 它 由 模式 、 外 模式 、 内 模式 及 两 级 映射 组 成 ,这 种 结构 保证 了 数据 的 物理 独 
立 性 和 人 逻辑 独立 性 ;最 后 简 述 了 数据 库 应 用 系统 体系 架构 和 数据 库 系 统 的 组 成 模块 ,介绍 
了 数据 处 理 的 历史 及 发 展 阶段 。 

应 重点 掌握 数据 库 的 几 个 基本 概念 、 数 据 库 的 应 用 举例 ,数据 模型 及 数据 库 系统 的 三 
级 模式 结构 的 内 容 。 


1.7 习题 


. 给 出 生活 中 不 使 用 数据 库 的 例子 。 
.给 出 你 经 常 接触 到 需要 使 用 数据 库 的 例子 ,并 分 析 需 要 保存 到 数据 库 里 的 数据 。 
. 简 述 数据 数据库、 数据 库 管理 系统 数据库 系 统 的 概念 。 
. 简 述 数据 库 管理 系统 的 功能 。 
. 简 述 数据 库 系 统 涉及 的 几 类 用 户 及 其 职责 。 
. 调查 市 场 上 有 哪些 数据 库 管理 软件 , 排 在 前 三 位 的 数据 库 管理 软件 是 什么 , 约 占 
多 少 份额 。 
7. 列 出 国内 研制 的 比较 有 名 的 数据 库 管理 软件 。 
8. 你 学 习 此 门 课程 有 什么 目标 吗 ? 
9. 简 述 数据 模型 的 三 要 素 。 
10. 与 层次 模型 相 比 ,网 状 模型 的 优点 是 什么 ? 为 什么 它 最 终 被 关系 模型 所 替代 ? 
11. 解释 模式 、 外 模式 、 内 模式 的 概念 。 如 何 保证 数据 的 逻辑 独立 性 和 物理 独立 性 ? 
12. 查询 相关 资料 ,了 解数 据 库 应 用 系统 体系 架构 中 的 并 行 架构 及 分 布 式 架构 。 
13. 简 述 数据 管理 技术 发 展 的 3 个 阶段 。 


Dan 省 
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第 2 章 ”关系 模型 数据 库 


本 章 主要 讲述 关系 数据 模型 的 静态 结构 ,从 数据 结构 和 完整 性 约束 条 件 两 方面 详细 
介绍 关系 模型 ,并 用 形式 化 的 语言 来 定义 关系 模型 。 

关系 数据 库 应 用 数学 方法 来 处 理 数据 ,具有 结构 简单 、 理 论 基础 坚实 数据 独立 性 高 
以 及 提供 非 过 程 性 语言 等 优点 。 

关系 模型 数据 库 简称 关系 数据 库 , 指 的 是 逻辑 模型 为 关系 模型 的 数据 库 , 采 用 关系 模 
型 作为 数据 的 组 织 方式 。 


2.1 关系 模型 数据 库 的 数据 结构 


在 数据 库 的 逻辑 模型 中 ,关系 模型 是 目前 应 用 最 广泛 的 数据 模型 。 下 面 先 介绍 关系 
模型 的 一 些 基本 概念 及 关系 的 性 质 , 然 后 形式 化 定义 关系 模型 。 


2.1.1 关系 模型 的 基本 概念 


1. 关系 


关系 模型 中 用 于 描述 数据 的 主要 结构 是 关系 (relation)。 数 据 对 象 用 关系 表示 ,数据 
对 象 之 间 的 联系 用 关系 表示 ,对 数据 对 象 的 操作 就 是 对 关系 的 运算 ,关系 运算 的 结果 仍然 
是 关系 。 这 是 关系 数据 模型 的 一 大 特点 , 即 用 关系 表示 一 切 。 实 际 上 ,关系 就 是 一 张 二 
维 表 。 

例如 , 某 校 的 学 生 基本 信息 如 表 2. 1 所 示 。 二 维 表 的 名 字 就 是 关系 的 名 字 , 表 2.1 的 
关系 名 就 是 “学 生 ”。 





表 2.1 学 生 关系 表 
学 号 姓 名 性 别 年 龄 籍 贯 
160610101 张 明 男 20 江苏 
160610102 刘 红 女 19 山东 
160610103 王 明 女 20 北京 
160610104 张 立 男 18 陕西 





2. 元 组 


关系 是 一 个 二 维 表 , 表 中 的 每 行 对 应 一 个 元 组 (tuple) 。 
例如 , 表 2. 1 中 学 号 为 160610101 的 学 生 信息 (160610101, 张 明 , 男 ,20, 江 苏 ) 就 是 一 
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个 元 组 。 表 2. 1 中 有 4 个 元 组 ,实际 上 就 代表 了 4 个 学 生 的 具体 信息 。 
3. 属性 


关系 中 的 每 列 对 应 一 个 属性 (attribute) ,也 叫 作 关系 中 的 字段 。 
例如 ,姓名 、 性 别 \ 年 龄 .籍贯 都 是 学 生 的 属性 ,是 对 学 生 特征 的 描述 。 


4. 域 


域 (domain) 是 一 组 具有 相同 数据 类 型 的 值 的 集合 。 

例如 ,整数 的 集合 、 实 数 的 集合 、 字 符 串 的 集合 、{' 男 ',' 女 ,全体 教师 的 集合 、{0,1)、 
小 于 100 的 正 整 数 、 全 体 学生 的 集合 ,都 可 以 是 域 。 属 性 的 取 值 范围 就 来 自 某 个 域 , 如 年 
龄 的 域 为 整数 。 


5. 分 量 


分 量 (component) 即 元 组 中 的 属性 值 。 
例如 , 刘 红 的 性 别 为 “ 女 ” 就 是 一 个 分 量 , 元 组 (160610101, 张 明 , 男 ,20, 江 苏 ) 中 有 5 
个 分 量 。 


6. 码 和 候选 码 


码 (key) 也 叫 作 键 或 者 关键 字 , 它 是 关系 中 能 唯一 标识 一 个 元 组 的 属性 或 者 属性 组 。 

例如 ,在 上 面 的 学 生 关系 表 中 ,假设 姓名 不 重复 , 则 存在 两 个 码 “ 学 号 “姓名 ”, 可 以 分 
别 用 学 号 值 或 姓名 值 代表 一 个 具体 的 学 生 。 例 如 ,学 号 160610101 代表 一 个 学 生 , 刘 红 代 
表 一 个 学 生 , 但 是 如 果 出 现 学 生 重 名 的 情况 ,姓名 就 不 能 作为 学 生 关 系 的 一 个 码 , 不 能 唯 
一 代表 一 个 学 生 。 而 候选 码 (candidate key) 实 际 上 就 是 码 , 也 叫 作 候选 键 或 者 候选 关 
键 字 。 

码 不 一 定 由 单一 属性 构成 ,有 可 能 由 多 个 属性 组 合 构成 。 

例如 , 表 2.2 中 , 码 由 “学 号 ”和 “课程 编号 ”组 合 而 成 ,任意 单独 的 一 个 学 号 或 一 个 课 
程 编号 都 不 能 唯一 标识 选课 关系 的 一 个 元 组 ,只 能 由 “学 号 ”及 “课程 编号 "组 合 起 来 代表 
一 个 选课 记录 。 

表 2.2 学 生 选 课 关系 表 
学 号 课程 编号 成 绩 
01 78 


1 
01 2 87 
01 3 89 
1 
2 





02 80 
76 


02 





例如 , 表 2. 3 中 , 码 为 “员工 编号 十 项 目 编号 ”。 
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表 2.3 员工 参与 项 目 关系 表 





员工 编号 项 目 编号 工作 时 长 /h 
01 P1 10 
01 P2 2 
01 P3 8 
02 Ea 6 
03 P2 8 





7. 主 码 


一 个 关系 中 可 能 有 多 个 候选 码 , 可 以 选 定 其 中 一 个 候选 码 作 为 主 码 (primary key) 
(主键 或 者 主 关键 字 ) 。 假 设 姓名 不 重 名 ,在 学 生 关系 的 两 个 候选 码 中 ,我 们 选取 学 号 为 主 
码 。 当 然 ,也 可 以 选 “ 姓 名 ”为 主 码 。 一 般 根据 人 们 的 习惯 选择 主 码 。 


8. 主 属性 

主 属性 (prime attribute): 包含 在 任意 码 中 的 属性 。 
例如 ,学 生 关系 中 的 学 号 、 姓 名 都 是 主 属性 。 

9. 非 主 属性 


不 包含 在 任何 候选 码 中 的 属性 称 为 非 主 属性 (nonprime attribute) 或 ( 非 码 属性 ) 。 
例如 ,学生 关 系 表 中 的 非 主 属性 是 性 别 、 年 龄 .籍贯 。 


10. 全 码 
关系 模式 的 候选 码 由 关系 表 的 所 有 属性 构成 , 称 为 全 码 (all-key)。 
11. 关系 模式 


关系 数据 库 中 ,关系 模式 (relation schema) 是 型 , 它 确定 关系 由 哪些 属性 构成 , 即 关 
系 的 逻辑 结构 ;而 关系 是 值 。 对 关系 的 描述 ,一 般 表 示 为 


关系 名 (属性 1, 属 性 2,… ,属性 n) 
例如 , 表 2.1 可 描述 为 
学 生 (学 号 ,姓名 ,性 别 ,年 龄 ,籍贯 ) 


以 上 概念 如 图 2. 1 所 示 ,关系 学 生 人 事 记 录 表 中 的 学 号 为 主 码 ,学 号 、 姓 名、 性 别 、 年 
龄 .籍贯 为 属性 名 ,姓名 “ 王 明 ” 为 分 量 ,20 为 年 龄 属性 值 ,“ 男 、 女 ”为 性 别 的 域 ,“9802 刘 
红 女 19 山东 ”为 一 个 元 组 。 

关系 是 关系 模式 在 某 一 时 刻 的 状态 和 内 容 。 关 系 模式 是 型 。 关 系 是 值 。 关 系 模式 
是 静态 的 ,稳定 的 。 而 关系 是 动态 的 、 变 化 的 。 实际 中 , 常 把 关系 模式 和 关系 统称 为 
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半 泗 
四 











学 生 人 事 记 录 表 一 一 一 关系 名 属性 名 



























































元 组 
关系 
图 2.1 学 生 人 事 记 录 
12. 关系 数据 库 模式 
在 一 个 给 定 的 现实 世界 领域 中 ,所 有 对 象 及 对 象 之 间 的 联系 的 集合 构成 一 个 关系 数 


据 库 。 
关系 数据 库 的 型 称 为 关系 数据 库 模式 。 关 系数 据 库 的 值 是 关系 数据 库 模 式 在 某 一 时 
刻 对 应 的 所 有 关系 的 集合 。 


2.1.2 关系 的 性 质 


关系 不 仅仅 是 表 , 它 应 该 满足 如 下 性 质 。 

(1) 列 是 同 质 的 , 即 每 列 中 的 数据 必须 来 自 同 一 个 域 , 具 有 相同 的 数据 类 型 。 

例如 , 表 2.4 中 年 龄 的 数据 类 型 必须 是 整数 ,不 能 用 出 生日 期 ;性 别 取 值 为 男 或 者 女 ， 
不 能 用 1 或 者 2 来 表示 。 类 似 地 ,要 求学 号 及 姓名 分 别 来 自 同一 





表 2.4 学 生 关 系 表 
学 号 姓 名 性 别 年 龄 曾 用 名 
160610101 张 明 男 20 张 狗 子 
160610102 刘 红 女 19 刘 小 红 
至 到 160610103 1 20 王 麻子 
160610104 张 立 2 2007/07/28 张 小 三 





(2) 每 列 必须 是 不 可 再 分 的 数据 项 (不 允许 表 中 套 表 )。 
在 关系 中 ,要 求 每 个 分 量 都 是 不 可 分 的 项 ,因此 表 2. 5 应 该 改 成 表 2. 6。 表 中 不 能 内 


套 表 。 
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表 2.5 职工 工资 表 1 











工 ， 注 
工 号 
We 车 痪 基本 工资 岗位 工资 绩效 工资 
20170201 李 书 香 1600 980 1200 
表 2.6 职工 工资 表 2 
好. 开学 姓 名 基本 工资 岗位 工资 绩效 工资 
20170201 李 书 香 1600 980 1200 














(3) 元 组 不 重复 , 即 不 能 有 相同 的 行 。 
表 2.7 中 出 现 了 两 个 一 样 的 学 生 信 息 , 因 此 是 错误 的 关系 。 














表 2.7 学 生 关系 表 
学 号 姓 名 性 和 别 年 龄 曾 用 名 
160610101 张 狗 子 
160610102 刘 小 红 
160610103 王 麻子 


160610101 张 狗 子 


(4) 元 组 无 序 性 ,即行 次 序 无 关 。 
例如 , 表 2.8 和 表 2. 9 实质 上 是 同一 个 关系 ,与 行 的 次 序 无 关 。 


表 2.8 学 生 关系 表 1 





学 号 姓 名 性 和 别 年 龄 
160610101 张 明 男 20 
160610102 刘 红 女 19 
160610103 王 明 女 20 
160610104 张 立 男 18 


表 2.9 学 生 关系 表 2 














学 号 姓 名 性 “ 别 年 龄 
160610101 张 明 男 20 
160610102 刘 红 19 
160610104 张 立 男 18 
160610103 王 明 女 20 


(5) 属性 无 序 性 , 即 列 次 序 无 关 。 
表 2. 10 和 表 2. 11 指 的 是 同一 个 关系 ,与 列 的 次 序 无 关 。 
表 2.10 学 生 关系 表 





学 号 姓 名 性 别 年 龄 
160610101 张 明 男 20 
160610102 刘 红 女 19 
160610103 王 明 女 20 
160610104 张 立 男 18 
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表 2.11 学 生 关系 表 





学 号 姓 名 年 龄 性 和 别 
160610101 张 明 20 男 
160610102 刘 红 19 女 
160610103 王 明 20 女 
160610104 张 立 18 男 





(6) 属性 不 同名 。 
表 2. 12 中 出 现 了 两 个 相同 的 属性 名 一 一 姓名 ,这 样 的 关系 是 不 正确 的 。 


表 2.12 学 生 关 系 表 





学 号 姓 名 性 和 别 年 龄 姓 名 
160610101 张 狗 子 
160610102 刘 小 红 
160610103 王 麻子 
160610104 张 狗 子 





2.1.3 关系 模型 的 形式 化 定义 


前 面 用 非 形式 化 的 方法 描述 了 关系 模型 ,关系 模型 有 严格 的 数学 理论 基础 , 它 建立 在 
集合 代数 理论 的 基础 上 。 下 面 从 集合 论 的 角度 给 出 关系 的 定义 。 


1. 笛 卡 儿 积 的 定义 


为 了 给 出 关系 的 形式 化 定义 ,首先 给 出 笛 卡 儿 积 (Cartesian Product) 的 定义 。 笛 卡 
儿 积 是 域 上 的 一 种 集合 运算 。 

定义 2.1 设 Di,D,,…,D, 是 n 个 域 ,它们 中 可 以 有 相同 的 域 , 则 它们 的 笛 卡 儿 
积 为 

D; XD; XxD,= {(di,di,"%,d,) | di € D;, i = 1,2,.",n} 

其 中 每 个 元 素 (di ,d;,…,d,) 称 为 一 个 元 组 ,元 素 (di,d,，…,d,) 中 的 每 个 值 d; 称 为 一 
个 分 量 。 

一 个 域 允许 的 不 同 取 值 个 数 称 为 这 个 域 的 基数 。 

车 D;(i 二 1,2,…,n) 为 有 限 集 ,其 基数 为 mi; (i 二 1,2,…,n), 则 Di XD;X…XD, 的 
基数 M 为 


NM 一 WT 
第 卡 儿 积 可 以 表示 为 一 个 二 维 表 。 每 个 元 素 (di ,d;,…,d,) 对 应 表 中 的 一 行 ,每 个 域 
对 应 一 列 。 
【 例 2. 1】 
设 Di 一 {01,02})， 
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了 :一 { 张 三 , 李 四 } 
则 Di XD:={(01, 张 三 ) ,(01, 李 四 ),(02, 张 三 ),(02, 李 四 )》 
可 用 二 维 表 表 示 为 

















01 三 
01 李 四 
02 登 
02 李 四 





Di XD 的 元 组 个 数 即 为 基数 2X2 一 4。 
【 例 2. 2 
设 Di:={ 张 三 , 李 四 )， 
DD, 二 {数学 ,语文 }， 
D: 王 ( 优 , 良 } 
则 D,XD:XD:=({( 张 三 ,数学 , 优 ),( 张 三 ,数学 , 良 ),( 张 三 ,语文 , 优 ),( 张 三 ,语文 ， 
良 ),( 李 四 ,数学 , 优 ) ,( 李 四 ,数学 , 良 ),( 李 四 ,语文 , 优 ) ,( 李 四 ,语文 , 良 )} 
可 用 二 维 表 表示 为 

















张 三 优 
全 良 
= 优 
= 良 

李 四 优 

李 四 良 

李 四 优 

李 四 良 





D1 XD XD; 的 基数 为 2X2X2 一 8。 
2. 关系 的 定义 


定义 2.2 DiXD:X…XD, 的 子 集 叫 作 在 域 D, ,D: ,…',D, 上 的 关系 ,表示 为 
RD ,D;,,…,D,) 

这 里 的 R 是 关系 的 名 字 ,n 是 关系 的 目 或 度 。 

关系 中 的 每 个 元 素 是 关系 中 的 一 个 元 组 ,通常 用 :表示 。 

当 ”一 1 时 , 称 该 关系 为 单元 关系 (UNARY RELATION) 或 者 一 元 关系 。 

当 "一 2 时 , 称 该 关系 为 二 元 关系 (BINARY RELATION)。 

例如 , 设 Di 为 员工 集合 下 = {e ,es),D; 为 项 目 集合 P=={p1,ps); 则 Di XD; 是 一 个 
二 元 关系 ,该 关系 的 元 组 个 数 即 为 基数 2X2 一 4, 这 个 关系 是 由 员工 集合 和 项 目 集合 中 的 
元 素 构成 。 


3. 关系 模式 的 定义 
关系 数据 库 中 ,对 关系 的 描述 称 为 关系 模式 。 关 系 模式 是 型 , 它 确定 关系 由 哪些 属性 
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构成 ;而 关系 是 值 。 
定义 2.3 关系 模式 形式 化 表示 为 
R(U.D.DOM,F) 

其 中 ,R 为 关系 名 ,U 为 该 关系 的 所 有 属性 ,D 为 U 中 属性 所 来 自 的 域 ,DOM 为 属性 
向 域 的 映像 ,F 为 属性 间 的 依赖 。 属 性 间 的 依赖 (如 函数 依赖 ) 在 后 面 的 章节 中 讨论 。 这 
里 ,关系 模式 表示 为 R(U,D,DOM) 

例如 ,在 学 生 关 系 中 ,性 别 的 域 为 男 ' 和 慷 ', 年 龄 的 域 为 整数 , 即 

DOM( 性 别 )={ 男 ', 女 ) 
DOM( 年 龄 ) 一 整数 

关系 模式 通常 可 以 简 记 为 R(D) 或 者 R(A1 ,A: ,…,A,)。 其 中 尺 为 关系 名 ,AiG=1， 
2,…,n) 为 属性 名 ,n 为 关系 的 度 。 而 域名 及 属性 向 域 的 映像 直接 说 明 属性 的 数据 类 型 和 
长 度 。 

关系 是 关系 模式 的 一 个 状态 ,表示 为 ~ 或 者 r(R) ,或 者 r 一 全 ,ww… 1,)。 

属性 A; 的 域 表 示 为 dom(A,) 。 

元 组 用 上 表示 为 上 王 二 mu ,… ,ww 二 ,每 个 值 w (1 二 i 二 nn) 是 域 dom(A;) 中 的 一 个 
元 素 。 
元 组 1 中 的 第 i 个 属性 值 表示 为 :LA;] 或 者 1. A;。 
关系 RR 中 的 某 个 属性 A; 表示 为 R.A;。 
例如 ,对 于 学 生 关 系 S(sno, sname, sage), 元 组 1 二 二 '01','tom',18 祖 ,tLsno]= 
<01> ,t[sage]=<=18>。 


4. 关系 数据 库 模式 的 定义 


关系 数据 库 模 式 是 关系 数据 库 的 型 ,是 对 关系 数据 库 的 整体 迎 辑 结构 的 措 述 。 对 于 
一 个 给 定 的 应 用 ,所 有 关系 的 集合 就 构成 了 一 个 关系 数据 库 , 这 些 关 系 的 模式 的 集合 就 构 
成 了 整个 关系 数据 库 的 模式 。 

【 例 2.3】 一 个 学 生 选 课 关 系数 据 库 中 包括 学 生 关系 student ,课程 关系 course、 选 修 
关系 sc, 数 据 结构 如 下 。 

(1) 学 生 : student(sno,sname,ssex,sage, sdept) ,依次 表示 学 号 、 姓 名、 性 别 、 年 龄 、 
所 在 系 。 

(2) 课程 : course(cno,cname,cpno,ccredit) ,依次 表示 课程 号 .课程 名 .先行 课程 号 、 
学 分 。 

(3) 选修 : sc(sno,cno,grade) ,依次 表示 学 号 .课程 号 .成 绩 。 

学 生 选 课 关系 数据 库 模式 如 图 2. 2 所 示 。 

【 例 2.4】 一 个 公司 的 数据 库 包括 员工 关系 employee、 部 门 关 系 department、 部 门 地 
址 关系 dept_locations、 项 目 关 系 project、 参 与 关系 works_on 和 家 属 关 系 dependent。 

(1) 员工 : employee(name, ssn,bdate,address, ssex, salary, superssn, dno) ,里面 的 
属性 依次 表示 职工 名 字 、 社 会 保险 号 .出生 日期, 地址、 性 别 . 工 资 .顶头 上 司 社会 保险 号 、 
部 门 编号 。 
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Student 

Sno sname SSeX sage sdept 
Course 

cno cname cpno ccredit 
SC 

Sno cno grade 

















图 2.2 学 生 选 课 关系 数据 库 模式 


(2) 部 门 : department(dname、dnumber、mgrssn、mgrstartdate) ,里 面 的 属性 依次 表 


示 部 门 名 称 .部 门 编号 .部 门 经 理 的 社会 保险 号 .开始 时 间 。 


(3) 部 门 地 址 : dept_locations(dnumber、dlocation), 里 面 的 属性 表示 部 门 编号 、 


地 址 。 


(4) 项 目 , project(pname、pnumber、plocation、dnum) ,里 面 的 属性 表示 项 目 名 称 、 项 


目 编号 ,项 目地 址 、 部 门 编号 。 


(5) 参与 works_on(essn、pno、hours), 里 面 的 属性 表示 职工 社会 保险 号 ,项 目 编 


号 ,小 时 数 。 为 员工 参与 项 目的 关系 。 


(6) 家 属 : dependent(essn、dependent_name、ssex、bdate、relationship) ,里面 的 属性 


依次 表示 职工 社会 保险 号 ,家属 名 字 性别 .出 生日 期 ,关系 。 
公司 数据 库 的 关系 模式 如 图 2. 3 所 示 。 


























































































































employee 
name ssn bdate address SSeX Salary Superssn dno 

department dname dnumber mgrssn mgrstartdate 
dept_locations dnumber | dlocation 
project 

pname | pnumber | plocation dnum 
works_on essn pno hours 
dependent 

essn dependent_name SSeX bdate relationship 

图 2.3 公司 数据 库 的 关系 模式 


5. 关系 数据 库 实 例 


关系 数据 库 实 例 是 某 时 刻 所 有 关系 模式 对 应 的 关系 的 集合 。 例 如 , 某 一 时 刻 学 生 选 


课 关 系数 据 库 如 图 2.4 所 示 。 
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student (sno, sname, ssex, sage, sdept) 





sno sname | ssex | sage | sdept 


160610101 | 刘 佳 | 女 19 | physics 
160610102 | 何 鼎 男 20 | network 
男 
女 












































































160610103 | 和 孙 亚 18 
160610105 | 张楚 19 | ab 
sc(sno, cno, grade) Course(cno, cname, cpno, ccredit) 
no oo | grade [eo Toname Tepno| ccredit| 
160610101 1 91 1 ET 5 
160610101 2 87 7 本 
ooo | 一 一 区 3 | [1 |4 
2 2 和 
160610102 | 3 sl 4 操作 系统 |6 |3 
5 数据 结构 |7 |4 
6 计算 机 网 络 | 4 。 |3 
7 C 语 言 6 |4 
8 大 学 物理 |2 |4 











2.4 学生 选课 关系 数据 库 


例 2.4 中 , 某 一 时 刻 公 司 数据 库 如 表 2. 13 一 表 2. 18 所 示 。 


表 2.13 employee 





























name bdate address SSeX Salary Superssn dno 
张 宏 123456789 1965-01-07 湖南 男 40000 333445555 5 
李 丽 333445555 1955-12-02 湖北 女 50000 987987987 5 
王 湘 999887777 1967-01-09 | 江西 女 35000 987654321 4 
何 慧 987654321 1970-03-18 广西 女 53000 987987987 4 
刘 思 源 666884444 1975-03-16 | 广东 男 48000 333445555 5 
李清照 123123123 1982-11-11 内 蒙古 女 35000 333445555 5 
王 安 456456456 1985-01-05 上 海 男 65000 987654321 4 
郑 敏 987987987 1968-01-09 湖南 女 43000 h 











dname dnumber mgrstartdate 
规划 处 5 333445555 1988-05-22 
行政 管理 4 987654321 1995-01-01 
人 事 处 1 987987987 2010-06-18 
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表 2.15 


dnumber 


dept_locations 


dlocation 





pname 


am an mn 中 


pnumber 


表 2.16 project 


plocation 


武汉 
长 沙 
长 沙 
上 海 
北京 


dnum 














表 2.17 works_on 
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essn pno hours 
123456789 1 32.5 
123456789 2 乱 甸 
666884444 这 40.0 
123123123 1 20.0 
123123123 10.0 
333445555 2 10.0 
333445555 3 10.0 
333445555 10 10.0 
333445555 20 30.0 
333445555 30 10.0 
999887777 10 35.0 
999887777 10 5.0 
456456456 30 20.0 
表 2.18 dependent 
essn dependent_name SSEX bdate relationship 
333445555 李霞 女 1986-04-06 女儿 
333445555 晋 胶 男 1983-07-12 儿子 
333445555 何晴 过 1958-05-06 配偶 
987654321 孙武 男 1968-01-01 配偶 
123456789 张 宏 男 1988-04-07 儿子 
123456789 张 菲 菲 女 1986-09-14 女儿 
123456789 陈 慧 芬 女 1967-05-05 配偶 
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2.2 关系 模型 的 完整 性 


关系 模型 的 完整 性 规则 是 对 关系 的 某 种 约束 条 件 。 也 就 是 说 ,关系 中 的 值 必须 满足 
一 定 的 约束 条 件 , 使 关系 中 的 值 有 意义 ,而 且 可 以 反映 现实 世界 的 要 求 。 

关系 模型 中 有 3 类 完整 性 约束 : 实体 完整 性 (ENTITY INTEGRITY) .参照 完整 性 
(REFERENTIAL INTEGRITY) .用户 自 定义 完整 性 (USER-DEFINED INTEGRITY) 。 
其 中 ,实体 完整 性 和 参照 完整 性 是 关系 模型 必须 满足 的 完整 性 约束 条 件 ,由 数据 库 管 理 系 
统 自 动 支持 。 而 用 户 自 定义 完整 性 是 用 户 根据 应 用 环境 要 求 定义 的 约束 条 件 。 


2.2.1 实体 完整 性 


用 实体 完整 性 约束 条 件 保 证 关系 中 的 每 个 元 组 都 是 可 区 分 的 ,是 唯一 的 。 

规则 2.1 实体 完整 性 规则 基本 关系 RR 必须 包含 有 码 , 且 主 属性 不 能 取 空 值 。 实 
体 完 整 性 也 称 主键 约束 。 

空 值 表 示 3 种 意义 : 还 不 知道 具体 的 值 ; 思 值 不 存在 ; @ 值 无 意义 。 

例如 ,学 生 关 系 ( 学 号 ,姓名 ,性 别 ,年 龄 ,班级 ) ,学 号 为 码 , 学 号 不 能 取 空 值 。 

例如 ,员工 关系 (员工 编号 ,员工 姓名 ,年 龄 ,薪水 ,职称 ,部 门 ), 员 工 编号 为 码 ,员工 编 
号 不 能 取 空 值 。 

例如 ,员工 参与 项 目 关 系 ( 员 工 编号 ,项 目 编号 ,工作 时 长 ) 中 ,员工 编号 和 项 目 编号 的 
属性 都 不 能 为 空 值 。 

实体 完整 性 规则 保证 如 下 内 容 。 

(1) 关系 中 不 会 出 现 重复 的 元 组 记录 。 

(2) 关系 中 的 每 个 元 组 都 是 唯一 的 。 

(3) 关系 中 的 主 属性 不 为 空 值 。 





2.2.2 参照 完整 性 


数据 之 间 往 往 存在 某 种 联系 。 在 关系 模型 中 ,数据 之 间 的 联系 也 用 关系 来 描述 。 这 
样 ,关系 之 间 就 存在 着 某 种 引用 。 

【 例 2.5】 下 面 是 学 生 关 系 和 班级 关系 ,其 中 主 码 用 下 画 线 标识 。 

学 生 (学 号 ,姓名 ,性 别 , 班 级 编号 ,年 龄 ) 

班级 (班级 编号 ,班级 人 数 ,班主 任 ) 

这 两 个 关系 之 间 存 在 属性 的 引用 , 即 学 生 关系 引用 了 班级 关系 的 主 码 “ 班 级 编号 ”。 
很 明显 ,学 生 关系 中 的 “班级 编号 ”的 值 必须 是 确实 存在 的 班级 , 即 班 级 关系 中 存在 该 班 
级 。 也 就 是 说 ,学 生 关 系 中 的 班级 取 值 需要 参照 班级 关系 的 班级 编号 取 值 。 

【 例 2.6】 下 面 是 员工 关系 和 部 门 关系 。 

员工 (员工 编号 ,员工 姓名 ,性 别 , 工 资 , 部 门 ) 




















35 | 一 


数据 库 原理 及 应 用 


部 门 (部 门 编号 ,部 门 名 字 ,部门 经 理 ) 

这 两 个 关系 之 间 也 存在 属性 的 引用 , 即 员工 关系 引用 了 部 门 关 系 的 主 码 “部 门 编号 ”， 
员工 必须 来 自 实 实在 在 存在 的 部 门 , 换 句 话说 ,员工 的 部 门 属性 值 参 照 了 部 门 关系 的 部 门 
编号 属性 取 值 。 

【 例 2.7】 学 生 关系 .课程 关系 .选课 关系 之 间 也 存在 类 似 情形 。 

学 生 ( 学 号 ,姓名 ,性 别 , 班 级 编号 ,电话 ) 

课程 (课程 编号 ,课程 名 字 , 学 分 ) 

选课 (学 号 ,课程 编号 ,成 绩 ) 

选课 关系 中 的 学 号 值 引 用 了 学 生 关系 中 的 学 号 值 , 必 须 是 存在 的 学 生 才 可 以 选课 ; 同 
样 ,选课 关系 中 的 课程 编号 值 引 用 了 课程 关系 中 的 课程 编号 值 ,必须 是 存在 的 课程 才 可 以 
被 选修 。 

员工 关系 、 项 目 关系 、 参 与 关系 之 间 也 存在 类 似 情 形 。 

员工 (员工 编号 ,员工 姓名 ,性 别 , 工 资 ,部 门 ) 

项 目 ( 项 目 编号 ,项 目 名 字 , 项 目 负 责 人 ) 

参与 (员工 编号 ,项 目 编号 ,工作 时 长 ) 

参与 关系 中 的 员工 编号 和 项 目 编号 必须 分 别 是 员工 关系 和 项 目 关 系 中 已 存在 的 值 。 
也 就 是 说 ,必须 是 存在 的 员工 和 存在 的 项 目 ,它们 的 值 必须 分 别 参照 员工 关系 和 项 目 关系 
中 相应 属性 的 值 。 

这 些 例子 说 明 关 系 与 关系 之 间 存 在 相互 引用 、 相 互 约束 的 情况 。 下 面 先 给 出 外 码 的 
定义 ,然后 再 给 出 表达 关系 之 间 相 互 引用 的 参照 完整 性 约束 的 定义 。 

定义 2.4 设 下 是 基本 关系 尺 的 一 个 或 一 组 属性 ,但 不 是 RR 的 码 ,如 果 下 与 基本 关系 
S 的 码 Ks 对 应 , 则 称 下 是 基本 关系 R 的 外 码 (外 键 或 者 外 关键 字 ) ,并 称 基本 关系 RR 为 参照 
关系 ,基本 关系 S 为 被 参照 关系 或 者 目标 关系 。 注 意 : 关系 尺 和 S 不 一 定 是 不 同 的 关系 。 

显然 ,目标 关系 S 的 码 Ks 和 参照 关系 R 的 外 码 下 必须 定义 在 同一 个 域 上 。 

在 前 面 的 例子 中 ,学 生 关 系 中 的 “班级 编号 ”与 班级 关系 中 的 主 码 “ 班 级 编号 "相对 应 , 因 
此 ,“ 班 级 编号 "属性 是 学 生 关系 的 外 码 。 学 生 关 系 为 参照 关系 ,而 班级 关系 为 被 参照 关系 。 

员工 关系 与 部 门 关系 之 间 , 员 工 关 系 是 参照 关系 ,部 门 关系 为 被 参照 关系 ,其 中 员工 
关系 的 “部 门 ”为 外 码 。 

注意 : 外 码 并 不 一 定 与 相应 的 码 同名 。 

类 似 地 ,员工 关系 、 项 目 关 系 、 参 与 关系 之 间 的 联系 如 图 2.5 所 示 。 
参与 关系 


员工 编号 | 项 目 编号 | 工作 时 长 


0 


员工 编号 | 员工 姓名 | 性别 工资 部 门 项 目 编号 | 项 目 名 称 | 项 目 负责 人 
























































员工 关系 项 目 关系 
2.5 员工 关系 \ 项 目 关系 参与 关系 之 间 的 联系 
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参与 关系 中 的 “员工 编号 "和 ”项 目 编号 ?都 是 外 码 。 员 工 关 系 和 项 目 关系 都 是 被 参照 

参照 完整 性 规则 定义 了 码 和 外 码 之 间 的 引用 规则 。 

规则 2.2 参照 完整 性 规则 ” 若 属 性 (或 属性 组 )F 是 基本 关系 R 的 外 码 , 它 与 基本 
关系 S 的 码 Ks 相对 应 (基本 关系 R 和 S 不 一 定 是 不 同 的 关系 ), 则 对 于 R 中 每 个 元 组 在 
上 的 值 必须 取 空 值 (F 的 每 个 属性 均 为 空 值 ) 或 等 于 S 中 某 个 元 组 的 Ks 值 。 

参照 完整 性 也 称 外 键 约束 。 

【 例 2.8】 学 生 关系 中 的 “班级 编号 ”属性 的 取 值 只 能 是 下 列 两 类 值 。 

空 值 ,表示 尚未 给 这 个 学 生 分 配 班级 ,或 者 还 不 清楚 这 个 学 生 的 班级 。 

非 空 值 ,必须 是 班级 关系 中 的 某 个 班级 编号 值 ,表示 该 学 生 不 可 能 分 配 到 一 个 不 存在 
的 班级 中 。 

【 例 2.9】 在 员工 参与 项 目的 例子 中 ,参与 关系 的 “员工 编号 ”是 外 码 , 其 值 要 么 为 
“ 空 ”, 要 么 为 员工 关系 中 某 个 “员工 编号 ”的 值 ,但 是 参与 关系 中 的 “员工 编号 ”为 主 属性 ， 
实体 完整 性 规则 定义 主 属性 不 能 为 空 ,因此 参与 关系 中 的 “员工 编号 ”只 能 为 员工 关系 中 
某 “员工 编号 ”的 值 。 同 样 ,参与 关系 中 的 “项 目 编号 "是 外 码 , 不 能 取 空 值 , 它 的 值 也 只 能 
来 自 项 目 关系 中 存在 的 项 目 编号 值 。 类 似 地 ,如 图 2.6 所 示 , 学 生 的 学 习 成 绩 关 系 也 存在 
同样 的 情况 ,其 外 键 “学 号 ”的 值 必须 来 自学 生 关 系 中 存在 的 “学 号 ”的 值 。 
















































































学 生 关 系 课程 关系 学 习 成 绩 关 系 
让 让 
a 
2 和 家 a 学 引 | 课程 号 | 公顷 
有 < 和 ys 9901 col 90 
9901 张 三 计 入 9901 C02 80 
9902 | 李 而 计算 机 C02 | 数据 结构 | 70 9902 | C04 90 
9903 | 王 五 | 计算 机 C03 | 操作 系统 | 80 9904 | co04 85 
9904 六 | 计算 机 C04 | 数据 库 | 60 9904 C03 70 









































图 2.6 学 生 选课 数据 库 


在 参照 完整 性 规则 里 ,参照 关系 和 被 参照 关系 可 以 是 同一 个 关系 。 

【 例 2.10】 员工 (员工 编号 ,员工 姓名 ,性 别 , 工 资 ,部门 ,直接 领导 人 ) ,这 里 的 “直接 
领导 人 ”参考 本 身 关系 中 的 主 码 “ 员 工 编号 ”, 其 中 “直接 领导 人 ”是 外 码 , 员 工 关系 既是 参 
照 关系 ,又 是 被 参照 关系 ,属性 “直接 领导 人 ”的 取 值 要 么 为 空 ,要 么 为 “员工 编号 ”属性 中 
出 现 的 值 。 





2.2.3 用户 自 定义 完整 性 


用 户 自 定义 完整 性 是 针对 某 一 具体 关系 数据 库 的 约束 条 件 , 它 反映 某 一 具体 应 用 所 
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涉及 的 数据 必须 满足 的 语义 要 求 。 关 系数 据 库 管 理 系统 提供 了 定义 和 检验 这 类 完整 性 的 
机 制 。 用 户 自 定义 完整 性 也 叫 用 户 自 定义 约束 。 

例如 : 
(1) 规定 某 一 属性 的 取 值 范围 为 0 一 100。 

(2) 规定 员工 一 周 工 作 的 最 长 时 间 为 56h。 

(3) 规定 讲师 的 工资 不 能 超过 教授 的 工资 。 

(4) 规定 学 生 的 性 别 取 值 只 能 为 “ 男 "或 者 “ 女 ”。 

完整 性 的 定义 可 在 定义 关系 结构 时 设置 ,也 可 以 之 后 再 通过 触发 器 ,规则 ,约束 来 设 
开发 数据 库 应 用 系统 时 ,定义 完整 性 是 一 项 非常 重要 的 工作 。 例 如 : 

(1) 定义 关系 的 主键 。 

(2) 定义 关系 的 外 键 。 

(3) 定义 属性 是 否 为 空 值 。 

(4) 定义 属性 值 的 唯一 性 。 

(5) 定义 属性 的 取 值 范围 。 

(6) 定义 属性 的 默认 值 。 

(7) 定义 属性 间 函 数 依赖 关系 。 


2.3 ”本 书 示例 数据 库 


示例 1: 学 生 选 课 关 系数 据 库 , 如 图 2.7 所 示 ,其 中 标 下 画 线 的 为 主 码 。 


student (sno, sname, ssex, sage, sdept) 














时 





So Sname ssex sage sdept 
| too6io101 | 难 | 女 | 19 | ps | 

































































160610102 | {98 | 男 | 20 | namet | 
160610103 | 台面 | 男 | 18 [compuer | 
160610105 | 张 慧 女 19 | dabbase 
sc(sno, cno, grade) course(cno, cname, cpno, ccredit) 
sn0 no grade cno cname cpno | ccredit 
160610101 1 91 1 数据 库 5 4 
160610101 2 37 2 数学 2 
160610101 | 3 8 3 信息 系统 |1 [4 
160610102 2 9 4 操作 系统 6 3 
2 3 
160610102 3 81 5 产 据 结构 7 4 
6 计算 机 网 络 | 4 | 3 
7 Ci 语言 6 4 
s | |2 | 

















图 2.7 学 生 选课 关系 数据 库 
sc(sno,cno,grade) 中 ,sno 和 cno 分 别 是 外 键 。 
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示例 2: 公司 数据 库 如 表 2. 13 一 表 2. 18 所 示 , 标 实 下 画 线 的 为 主 码 , 标 虚 下 画 线 的 
为 外 码 。 

dept_locations 中 ,dnumber 既 为 主 码 的 一 部 分 ,又 为 外 码 ;works_on 中 ,essn 和 pno 
是 组 合 主 码 , 又 分 别 为 外 码 ;dependent 中 ,essn 既 为 主 码 的 一 部 分 ,又 为 外 码 。 


2.4 小 结 


本 章 介绍 了 关系 数据 库 的 数据 结构 以 及 完整 性 约束 ,关系 数据 库 的 数据 结构 为 关系 ， 
它 的 完整 性 约束 包含 实体 完整 性 约束 、 参 照 完整 性 约束 、 用 户 自 定义 完整 性 约束 。 关 系数 
据 模型 是 建立 在 严格 的 数据 理论 基础 之 上 的 ,因此 ,本 章 详 细 讲 述 了 关系 模型 形式 化 的 
定义 。 

本 章 还 详细 介绍 了 关系 模型 的 基本 概念 ,包括 关系 \ 元 组 ,属性 、 域 .分量 、 码 \ 主 码 , 主 
属性 、 非 主 属性 ,全 码 ,关系 模式 .关系 数据 库 模式 ,给 出 了 两 个 关系 数据 库 模式 及 其 实例 ， 
它们 是 学 生 选 课 关系 数据 库 和 公司 数据 库 。 这 两 个 数据 库 将 贯穿 本 书 的 各 个 章节 ,是 本 
书 的 示例 数据 库 。 


2.5 习题 


. 解释 如 下 概念 : 码 、 主 码 、 候 选 码 . 主 属性 、 非 主 属 性 、 全 码 。 

. 解释 数据 库 模式 和 数据 库 实例 ,并 举例 说 明 。 

. 关系 的 性 质 有 哪些? 

. 什么 是 笛 卡 儿 积 ? 举例 说 明 。 并 说 明 关系 与 笛 卡 儿 积 之 间 有 什么 联系 。 
.什么 是 参照 完整 性 约束 ?举例 说 明 。 

.什么 是 实体 完整 性 约束 ?举例 说 明 。 


wD 
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第 3 章 关系 代数 


从 数据 结构 .数据 操作 、 完 整 性 约束 3 个 方面 描述 数据 模型 。 第 2 章 讲述 了 关系 数据 
模型 的 数据 结构 及 完整 性 约束 ,本 章 主要 讲述 关系 数据 模型 的 动态 行为 ( 即 数据 操作 ) 。 
关系 数据 库 操作 涉及 操作 内 容 、 使 用 语言 及 实现 方法 。 


3.1 关系 操作 


关系 的 操作 采用 集合 操作 方式 ,操作 的 对 象 和 结果 都 是 集合 ,操作 方式 是 一 次 一 集合 
(set-at-a-time) ,而 非 关系 数据 库 的 操作 是 一 次 一 记录 (record-at-a-time)。 

关系 模型 常用 的 操作 分 为 两 类 : 一 类 为 非 查 询 操 作 , 包 括 插入 (insert)、 删 除 
(delete) ,修改 (update) ;一 类 为 查询 操作 。 

关系 的 查询 表达 能 力 很 强 , 是 关系 操作 的 主要 部 分 。 查 询 操作 包括 选择 (select) \ 投 
影 (project) .连接 (join)、 除 (divide) 、 并 (union)、 交 (intersection) 、 差 (except) 、 笛 卡 儿 积 
(Cartesian Product) 等 。 其 中 ,选择 ,投影 .并 、 差 , 笛 卡 儿 积 是 5 种 基本 操作 ,其 他 操作 可 
以 由 基本 操作 定义 和 导出 。 


3.2 关系 操作 的 语言 


关系 操作 集合 的 能 力 通常 用 关系 代数 或 关系 演算 表示 。 关 系 代数 是 用 关系 的 运算 来 
表达 查询 要 求 。 关 系 演算 则 是 用 谓词 来 表达 查询 要 求 。 关 系 演算 又 可 按 谓 词 变 元 的 基本 
对 象 是 元 组 变量 ,还 是 域 变 量 分 为 元 组 关系 演算 和 域 关系 演算 。 关 系 代数 ,关系 演算 、 域 
演算 这 3 种 语言 在 表达 能 力 上 是 完全 等 价 的 。 

关系 代数 .关系 演算 ` 域 演算 这 3 种 语言 都 是 抽象 的 查询 语言 ,它们 与 具体 的 DBMS 
中 实现 的 实际 语言 并 不 一 样 ,但 它们 能 作为 评估 实际 系统 中 查询 语言 的 标准 或 基础 。 
DBMS 中 实际 的 查询 除了 提供 关系 代数 和 关系 演算 中 定义 的 功能 外 ,还 提供 许多 附加 功 
能 ,如 聚集 函数 .关系 赋值 .算术 运算 等 。 

另外 ,还 有 一 种 介 于 关系 代数 和 关系 演算 之 间 的 语言 SQL (Structured Query 
Language) 。SQL 不 仅 具 有 丰富 的 查询 功能 ,而 且 具 有 数据 定义 、 数 据 控制 功能 ,是 集 数 
据 查询 ,数据 定义 数据 控制 .数据 操纵 于 一 体 的 关系 数据 语言 。 它 充分 体现 了 关系 数据 
语言 的 特点 和 优点 ,是 关系 数据 库 的 标准 语言 。 

因此 ,关系 数据 语言 分 为 3 类 ,如 图 3.1 所 示 。 





关系 代数 


关系 代数 语言 如 ISBL) 
元 组 关系 演算 语言 如 APLHA) 
关系 数据 语言 4 关系 演算 语言 
域 关 系 演算 语言 如 QBE) 
兼 具 关 系 代数 语言 和 关系 演算 语言 特点 的 语言 如 SQL) 
图 3.1 关系 数据 语言 的 分 类 


3.3 关系 代数 运算 


关系 代数 是 一 种 抽象 的 查询 语言 , 它 用 关系 的 运算 来 表达 查询 。 

关系 运算 体系 : 所 有 以 关系 为 运算 对 象 的 一 组 运算 符 及 其 对 应 运算 规则 的 合 称 。 

关系 代数 就 是 用 关系 运算 符 连接 操作 对 象 的 表达 式 ,而 操作 对 象 是 关系 ,其 操作 结果 
仍然 是 关系 ,关系 运算 符 有 传统 的 集合 运算 符 、 专 门 的 关系 运算 符 、 比 较 运算 符 以 及 逻辑 
运算 符 , 如 图 3.2 所 示 。 











专门 的 
关系 运算 符 














3.2 关系 代数 运算 符 


关系 代数 的 运算 按 运算 符 的 不 同 分 为 传统 的 集合 运算 、 专 门 的 关系 运算 。 比 较 运 算 
符 和 逻辑 运算 符 用 来 辅助 专门 的 关系 运算 符 进 行 查询 操作 。 关 系 是 行 的 集合 ,每 行 可 以 
看 成 一 个 元 素 , 因 此 ,关系 的 查询 请 求 可 以 采用 传统 的 集合 运算 来 表达 。 


3.3.1 传统 的 集合 运算 


传统 关系 运算 包括 并 \ 交 、 差 广义 笛 卡 儿 积 。 其 中 ,并 \ 交 、 差 运算 要 求 操作 对 象 具有 
相同 的 模式 , 即 操作 对 象 具 有 相同 的 目 且 相应 属性 的 取 值 来 自 同一 个 域 。 
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1. 并 运算 (通过 两 个 例子 ) 


设 关系 R 和 关系 S 具有 相同 的 目 n( 即 两 个 关系 都 及 个 属性 ), 且 相应 的 属性 值 取 
自 同 一 个 域 , 则 关系 RR 与 关系 S 的 并 由 属于 R 或 属于 S 的 元 组 组 成 ,其 结果 仍 为 目 关 
系 , 记 为 : 
RUS=( 人 tiERVIES} 
【 例 3. 1】 关系 尺 与 关系 S 的 并 运算 如 图 3. 3 所 示 。 
























































关系 R 关系 S RUS 

4A B C A B C A B C 
al bi cl al bl cl al bi cl 
ay b, cz al by 6 ay b, [2 
a b; [a a | b, a a by C3 

a b; c 

a; b, a 

图 3.3 并 运算 举例 一 


【 例 3.2】 R 为 男 学 生 关系 ,S 为 女 学 生 关 系 ,R 与 S 进行 并 运算 ,如 图 3.4 所 示 。 





























R: 男 学 生 关系 S: 女 学 生 关 系 
学 号 | 姓名 | 性 别 | 年 龄 | 专业 学 号 | 姓名 | 性 别 | 年 龄 | 专业 
1 | 刘 润 | 男 | 17 | 物理 7 | 李 俏 | 女 | 18 | 英语 
2 | 地 做 | 男 | 18 | 数学 | | 8 | 区 而 | 女 | 17 | 数学 | 
3 | 王 奇 | 男 | 19 | 物理 | 
RUS 
学 号 | 姓名 | 性 别 | 年 龄 | 专业 





17 | 物理 











| 李 俏 | 女 | 18 | 英语 
| 孙 两 | 女 | 17 | 数学 


图 3.4 并 运算 举例 二 

















但 是 ,student 关系 模式 和 teacher 关系 模式 一 般 不 进行 集合 运算 ,因为 它们 不 具有 相 
同 的 模式 。 


2. 交 运 算 
交 : 设 关系 尽 和 关系 S 具有 相同 的 目 n( 即 两 个 关系 都 有 个 属性 ), 且 相应 的 属性 


值 取 自 同一 个 域 , 则 关系 尺 与 关系 S 的 交 由 既 属于 RR, 又 属于 S 的 元 组 组 成 ,其 结果 仍 为 


n 目 关系 , 记 为 : 
RMNS= {leERNEES} 
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【 例 3. 3】 关系 尺 与 关系 S 的 交 运 算 如 图 3.5 所 示 。 















































关系 R 关系 S RNS 
A BG 4|B|c ra 
a | bl | 1 a | bla al | 5 | cl 
| b, | Cc a | by | c 
be | bs | G3 全 | b | a 
图 3.5 交 运 算 举例 一 


【 例 3.4】 R 为 男 学 生 关系 ,S 为 学 生 关系 ,R 门 S 为 男 学 生 关系 ,如 图 3.6 所 示 。 
R: 男 学 生 关系 5: 学 生 关系 
学 号 | 姓名 | 性 别 | 年 龄 | 专业 





















































3. 差 运算 


设 关系 R 和 关系 S 具有 相同 的 目 n( 即 两 个 关系 都 有 个 属性 ), 且 相应 的 属性 值 取 
自 同一 个 域 , 则 关系 尺 与 关系 S 的 差 由 属于 R 而 不 属于 S 的 元 组 组 成 ,其 结果 仍 为 n 目 
关系 , 记 为 
R—S={t|t€ERAzeS} 
【 例 3.5】 关系 尺 与 关系 S 的 差 运 算 如 图 3.7 所 示 。 







































关系 S R-S 
4|B|c 
cl a b, | ec 
b | mB| 六 | ss 
b, | ba 
图 3.7 差 运算 举例 一 


【 例 3.6】 R 为 学 生 关系 ,S 为 男 学 生 关 系 ,R 与 S 的 差 运 算 如 图 3. 8 所 示 。 
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R: 学 生 关系 S: 男 学 生 关系 
学 号 | 姓名 | 性 别 | 年 龄 | 专业 学 号 | 姓名 | 性 别 | 年龄 | 专业 
1 | 刘 润 | 男 | 17 | 物理 1 | 刘 润 | 男 | 17 | 物理 
2 | 地 敏 | 男 | 18 | 数学 2 | 地 敏 | 男 | 18 | 数学 
3 | 王 奇 | 男 | 19 | 物理 3 | 玉 奇 | 男 | 19 | 物理 
7 | 地 俏 | 女 | 18 | 英语 
8 | 孙 丽 | 女 | 17 | 数学 R 一 S: 女 学 生 关系 
学 号 | 姓名 | 性 别 | 年 龄 | 专业 
7 | 李 俏 | 女 | 18 | 英语 
8 | 孙 丽 | 女 | 17 | 数学 
图 3.8 差 运算 举例 二 


4. 笛 卡 儿 积 


尺 为 n 目 关系 ,S 为 m 目 关系 ,i, ER(, 为 关系 R 的 任 一 个 元 组 ),t,€ S(is 为 关系 S 
的 任 一 个 元 组 )。1,i, 称 为 元 组 的 连接 , 它 是 一 个 n 十 m 列 的 元 组 ,前 n 个 分 量 为 R 中 的 一 


个 n 元 组 ,后 mm 个 分 量 为 S 中 的 一 个 m 元 组 。 


这 里 的 笛 卡 儿 积 是 广义 的 笛 卡 儿 积 。 笛 卡 儿 积 的 元 素 是 元 组 。 
广义 笛 卡 儿 积 : 两 个 分 别 为 n 目 和 wm 目的 关系 R 和 S 的 广义 笛 卡 儿 积 是 一 个 十 m 列 
的 元 组 的 集合 。 元 组 的 前 列 是 关系 R 的 一 个 元 组 ,后 m 列 是 关系 S 的 一 个 元 组 。 若 尺 有 
ki 个 元 组 ,S 有 个 元 组 , 则 关系 尺 和 关系 S 的 广义 笛 卡 儿 积 有 ki Xks 个 元 组 。 记 为 
RxS={m,|t€ERNAtES) 
【 例 3.7】 关系 尺 与 关系 S 的 笛 卡 儿 积 运 算 如 图 3. 9 所 示 。 






























































图 3.9 第 卡 儿 积 举例 


关系 代数 


3.3.2 专门 的 关系 运算 


专门 的 关系 运算 包括 选择 ,投影 连接 、 除 运算 等 。 

1. 选择 运算 

选择 运算 是 对 给 定 的 关系 RR, 选 择 出 满足 条 件 的 行 (元 组 ) , 记 作 : 

or(R)= {1|1E€ERAFQ)= 真 } 

下 表示 选择 条 件 , 为 一 逻辑 表达 式 ,结果 取 逻 辑 * 真 ?或 “ 假 ”, 它 是 由 逻辑 运算 符 连 接 
算术 表达 式 而 成 的 条 件 表达 式 。 

惕 辑 运 算 符 有 与 (人 )、 或 CV). 非 (”)。 

算术 表达 式 的 基本 形式 为 

XOY 

其 中 ,X.Y 是 属性 名 、 常 量 或 简单 函数 ,属性 名 也 可 以 用 它 在 关系 中 的 位 置 序号 来 表示 。 
0 为 比较 运算 符 ,0€E {二 ,二 ,三 , 宇 , 取 , 二 }。 

选择 运算 就 是 从 关系 R 中 选取 使 逻辑 表达 式 下 为 真 的 元 组 。 

第 2.3 节 的 学 生 选 课 关 系数 据 库 ,包括 学 生 关系 student\ 课 程 关 系 course、 选 修 关 系 
sc, 数 据 结构 如 下 。 

学 生 : student(sno,sname, ssex, sage, sdept) ,依次 表示 学 号 、 姓 名、 性 别 、 年 龄 .所 
在 系 。 

课程 : course(cno, cname, cpno, ccredit) ,依次 表示 课程 号 .课程 名 . 先 修 课程 号 、 
学 分 。 

选修 : sc(sno,cno,grade) ,依次 表示 学 号 .课程 号 .成 绩 。 

本 章 后 面 的 内 容 都 基于 学 生 选 课 关 系数 据 库 。 

【 例 3.8】 查询 全 体 男 学 生 的 基本 信息 。 

gsex= 盟 (student) 或 者 cs-= 田 (student) 
【 例 3.9】 查询 年 龄 等 于 20 岁 的 男生 。 


Gsage=20Assex= 粤 '(Student) 或 者 ci-zoAs-= 男 (student) 
2. 投影 运算 


关系 R 中 的 投影 是 从 R 中 选择 出 若干 属性 列 组 成 新 的 关系 , 记 作 
Ma(R)= {tA]ItiER} 

其 中 ,A 为 R 中 的 属性 列 。 投 影 操 作 是 从 列 的 角度 进行 的 运算 。 

【 例 3.10】 查询 全 体 学 生 的 姓名 。 

Iwome (student) 或 者 Ia (student) 
【 例 3.11】 查询 学 生 表 中 的 姓名 及 性 别 。 
了 wwomewssex (Student) 或 者 [Lz,s (student) 
投影 运算 和 选择 运算 经 常 组 合 起 来 使 用 。 
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【 例 3.12】 查询 学 生 表 中 计算 机 系 的 学 生 的 姓名 。 
了 .ne (Gsgepe='computer (Student) ) 

或 者 JI (Gs= ompuer (student)) 

【 例 3.13】 查询 计算 机 系 年 龄 小 于 20 岁 的 学 生 学 号 和 姓名 。 

[sno, sname (Osdept= computerA sage<20 (Student)) 

或 者 Ili,s (G5="computerA 4<20 (Student)) 

投影 操作 取消 了 某 些 列 之 后 ,还 可 能 取消 某 些 重复 的 元 组 ,因为 取消 了 某 些 属性 列 
后 ,就 可 能 出 现 重 复 行 。 

【 例 3. 14】 查询 学 生 的 性 别 。 

I (student) 


其 结果 为 





SSeX 

















3. 连接 运算 


连接 运算 的 一 种 定义 方法 : 对 关系 R 和 关系 S 进行 笛 卡 儿 积 , 然 后 选择 出 满足 条 件 

的 元 组 , 记 作 : 
REAS = {0 11 € RA ESALLANLB)) 

A 和 B 分 别 为 R 和 S 上 度数 相等 且 可 比 的 属性 组 。0 为 比较 运算 符 。 连 接 运算 从 尺 
和 S 的 笛 卡 儿 积 RXS 中 选取 (R 关系 ) 在 A 属性 组 上 的 值 与 (S 关系 ) 在 也 属性 组 上 的 值 
满足 比较 关系 9 的 元 组 。 

当 0 为 “==” 时 ,连接 运算 为 等 值 连接 。 这 是 最 常用 的 一 种 连接 运算 , 它 是 从 关系 民 
与 S 的 笛 卡 儿 积 中 选取 A、B 属性 组 值 相等 的 那些 行 , 即 

RogS = {0 | 1 ERNL,E SNLA]= 418)) 

自然 连接 是 一 种 特殊 的 等 值 连接 ,两 个 关系 中 同名 的 属性 组 进行 等 值 连接 ,并 且 在 结 
果 中 去 掉 重 复 的 属性 列 , 即 若 R 和 S 中 具有 相同 的 属性 组 B,U 为 R 和 S 的 全 体 属性 集 
合 , 则 自然 连接 即 

RmS = {ntU—B]|i ERANL ESALB] = .8)) 

【 例 3.15】 图 3. 10 所 示 为 关系 尺 与 S 的 等 值 连接 R ,PasS 不 等 值 连接 、 自 然 
连接 。 

【 例 3.16】 图 3.11 所 示 为 关系 RR 与 S 的 等 什 连 接 R 。 ,pq ，S 及 自然 连接 。 

连接 运算 的 另 一 种 定义 方法 : 如 果 关 系 RR 和 关系 S 满足 条 件 ,就 连接 相应 的 元 组 ,并 
形成 结果 关系 表 中 的 一 个 元 组 ,否则 就 丢弃 。 

等 值 连接 ,实际 上 是 关系 R 和 关系 S 在 对 应 的 某 个 属性 值 上 相等 才 进 行 连接 。 

不 等 值 连接 ,实际 上 是 关系 R 和 关系 S 在 对 应 某 个 属性 值 上 满足 一 定 条 件 才 进行 





一 -46 











关系 代数 




























































































































































































关系 R 关系 5S 
A B C B E 
a 加 9 万 7 
"|b%|56 by T 
a by | 8 bp | 10 
a ba 12 by 2 
bs 2 
RDAS REAS 
RC<SE RB=S.B 
A |RB|C |SB|E A |RB|C |SB|IE 
a | |o | | wo a | | 9 | 2 
al |6 |%|7 al by | 6 |b 7 
a b, 6 b; 10 a b; 8 by 10 
图 3.10 关系 及 与 S 的 连接 运算 一 
关系 RR 关系 S 
4 B.C 4|B8|E 
a|b | 9 a bl 2 
a b, | 6 a b, 和 
a bs 8 a. bs 10 
ay 及 12 a. b; 2 
‘ bs 2 
bas 
Ba RMS 
R4[RET CTS4TS8[ E 4|8|c|e 
almlolal|lz a| blo|2 
ali| slalb|7| wm | 六 |6|7 
mb|8|a|b 10 | |b|8|10 
mb|8|e|b 2 | m|b|8|2 
图 3.11 关系 R 与 S 的 连接 运算 二 
连接 。 
连接 运算 是 两 个 表 之 间 的 运算 ,经 常 发 生 在 参照 关系 与 被 参照 关系 之 间 。 参 照 关 系 


的 外 码 与 被 参照 关系 的 主 码 之 间 满 足 一 定 的 条 件 , 如 相等 或 者 其 他 比较 关系 ,相应 的 元 组 
才 连 接 成 一 条 新 记录 ,成 为 结果 表 中 的 一 条 记录 。 

【 例 3.17】 查询 刘 佳 同学 的 选课 情况 ,包括 刘 佳 的 学 号 、 姓 名、 课程 编号 和 成 绩 , 结 
果 如 表 3. 1 所 示 。 

代数 表达 式 为 


I mms oom (Vino tt (Student) m sc) 
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表 3.1 刘 佳 同学 的 选课 情况 





Sno sname cno grade 
160610101 刘 佳 1 91 
160610101 刘 佳 2 87 
160610101 刘 佳 3 88 


【 例 3.18】 查询 选课 同学 的 选课 情况 。 采 用 等 值 连接 ,其 结果 如 表 3.2 所 示 。 





关系 代数 表达 式 为 
student DA ,se 
表 3.2 已 选课 的 同学 的 选课 情况 一 
sno sname SSeX Sage sdept sno cno grade 
160610101 刘 佳 女 19 physics 160610101 I 91 
160610101 刘 佳 女 19 physics 160610101 2 87 
160610101 刘 佳 女 19 physics 160610101 3 88 
160610102 何 觅 男 20 network | 160610102 2 90 
160610102 何 鹏 男 20 network 160610102 3 81 














采用 自然 连接 ,其 结果 如 表 3. 3 所 示 。 关 系 代数 表达 式 为 


student M sc 


表 3.3 已 选课 的 同学 的 选课 情况 二 



















sno sname SSeX Sage sdept cno grade 
160610101 女 physics 91 
160610101 女 physics 87 
160610101 女 physics 88 
160610102 男 network 90 
160610102 男 network 





【 例 3.19】 查询 选 卫 数据库? 课程 的 学 生 的 学 号 ,其 结果 如 表 3.4 所 示 。 
关系 代数 表达 式 为 


开 ,。。(aensme= 数 据 库 ,COUISe MSC) 
【 例 3.20】 查询 选 了 数据库? 课程 的 学 生 的 姓名 ,其 结果 如 表 3.5 所 示 。 
关系 代数 表达 式 为 


了 Iswome (Student M SC M(aeame= 数 据 库 ,COUISe) ) 





表 3.4 选 了 “数据 库 ” 课 程 的 学 生 的 学 号 表 3.5 选 了 “数据 库 ” 课 程 的 学 生 的 姓名 
sno sname 
160610101 刘 佳 


【 例 3.21】 查询 课程 被 选修 的 情况 ,包括 学 生 的 学 号 ,课程 号 .成绩 及 课程 的 所 有 基 
本 信息 ,其 结果 如 表 3.6 所 示 。 
关系 代数 表达 式 为 


SC™ course 
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sno 


表 3.6 查询 课程 被 选修 的 情况 


关系 代数 





grade cno cname cpno ccredit 
160610101 1 91 1 数据 库 5 4 
160610101 2 87 2 数学 2 
160610101 3 88 | 信息 系统 4 
160610102 多 90 2 数学 
160610102 3 81 3 信息 系统 4 





连接 运算 又 分 为 内 连接 运算 和 外 连接 运算 。 内 连接 是 指 满足 条 件 的 元 组 才 放 在 结果 
中 。 其 中 ,内 连接 包括 前 面 介绍 的 等 值 连接 、 不 等 值 连接 和 自然 连接 。 





【 例 3.22】 查询 已 选课 的 学 生 的 选课 情况 ,结果 如 表 3. 7 所 示 , 即 前 面 的 表 3. 2。 
表 3.7 已 选课 的 学 生 的 选课 情况 一 

sno sname SSeX Sage sdept sno cno grade 
160610101 刘 佳 女 19 physics 160610101 1 91 
160610101 刘 佳 女 19 physics 160610101 2 87 
160610101 刘 佳 女 19 physics 160610101 3 88 
160610102 何 鹏 男 20 network 160610102 2 90 
160610102 何 鹏 男 20 network 160610102 3 81 





在 学 生 关系 中 ,共有 4 个 学 生 , 有 2 个 学 生 ( 孙 晋 和 张 慧 ) 没 有 选课 。 如 果 没 有 选课 的 学 
生 的 基本 信息 (学 号 .姓名 性别、 年 龄 .所 在 系 ) 也 要 列 在 查询 结果 中 ,就 需要 用 到 外 连接 。 

外 连接 是 指 除了 满足 条 件 的 元 组 保留 在 结果 中 外 ,不 满足 条 件 的 元 组 也 保留 在 结果 
关系 中 。 外 连接 分 为 左 外 连接 (24) , 右 外 连接 (XD) 和 全 外 连接 (370) 。 

左 外 连接 : 除了 满足 条 件 的 元 组 保留 在 结果 关系 中 ,左边 关系 中 不 满足 条 件 的 元 组 





















































也 保留 在 结果 关系 中 ,其 对 应 的 右边 关系 中 属性 的 取 值 用 NULL 填充 。 
【 例 3.23】 关系 R 和 关系 S 进行 左 外 连接 ,如 图 3. 12 所 示 。 
关系 R 关系 S 
4 8 | < 4 Dp E 
a bl | ci al dl el 
ay b, | c> a 由 @ 
a by | C3 a. 办 @ 
ay ba | Cs 
RMS 
RA B C S4 D | < 
al bl ci a dl | el 
a bi a a dh | 。 
ay b, (a a 中 | @ 
人 性 © | NULL | NULL | NULL 
a by © | NULL | NULL | NULL 
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【 例 3.24】 查询 所 有 学 生 的 基本 信息 及 选课 的 学 生 的 选课 情况 ,其 结果 如 表 3.8 所 示 。 
关系 表达 式 为 


student ™ sc 


表 3.8 所 有 学 生 的 基本 信息 及 已 选课 的 学 生 的 选课 情况 





sno sname SSEX sage sdept sno cno grade 
160610101 刘 佳 女 19 physics 160610101 " 91 
160610101 刘 佳 女 19 physics 160610101 2 87 
160610101 刘 佳 去 19 physics 160610101 3 88 
160610102 何 鹏 男 20 network 160610102 2 90 
160610102 何 鹏 男 20 network 160610102 3 81 
160610103 孙 晋 男 18 computer NULL NULL | NULL 
160610105 张 慧 女 19 database NULL NULL NULL 





右 外 连接 : 除了 满足 条 件 的 元 组 保留 在 结果 关系 中 ,右边 关系 中 不 满足 条 件 的 元 组 
也 保留 在 结果 关系 中 ,其 对 应 的 左边 关系 中 属性 的 取 值 用 NULL 填充 。 
【 例 3.25】 关系 R 和 关系 S 进行 右 外 连接 ,如 图 3. 13 所 示 。 

































































关系 及 

丰 

4 |D | 本 

a dl el 高 

ala | 6 

a 办 6 过 

RMS 
RA D | 5 S4 B EC 
a dd | a a bi a 
a 中 | - a b A 
ay 大 | 6 a b, [2 
NULL | NULL | NULL| am bs cs 
NULL | NULL | NULL| a bs ci 
图 3.13 RMKXS 


【 例 3. 26】 查询 课程 的 被 选修 情况 ,包括 学 生 的 学 号 .课程 号 、 成 绩 及 所 有 课程 的 基 
本 信息 ,其 查询 结果 如 表 3. 9 所 示 。 





关系 表达 式 为 
scM course 
表 3.9 课程 的 被 选修 情况 
sno cno grade cno cname cpno ceredit 
160610101 1 91 1 数据 库 5 4 
160610101 2 87 2 数学 2 



































关系 代数 











续 表 
sno cno grade cno cname cpno ccredit 

160610101 3 88 3 信息 系统 1 4 
160610102 | 90 数学 2 
160610102 81 3 信息 系统 ¥ 4 
NULL NULL NULL 4 操作 系统 6 3 
NULL NULL NULL 5 数据 结构 7 4 
NULL NULL NULL 6 计算 机 网 络 4 3 
NULL NULL NULL 7 C 语 言 6 4 
NULL NULL NULL 8 大 学 物理 4 4 














全 外 连接 : 除了 满足 条 件 的 元 组 保留 在 结果 关系 中 ,左边 和 右边 不 满足 条 件 的 元 组 
都 保留 在 结果 关系 中 ,其 对 应 两 边关 系 中 的 属性 取 值 用 NULL 填充 。 
【 例 3.27】 查询 所 有 学 生 的 基本 信息 .所 有 课程 的 基本 信息 及 学 生 的 选课 情况 ,其 
查询 结果 如 表 3. 10 所 示 。 
表 3.10 所 有 学 生 的 基本 信息 .所 有 课程 的 基本 信息 及 学 生 的 选课 情况 
sno sname | ssex | sage sdept sno cno | grade | cno cname cpno | ceredit 
160610101| 刘 佳 19 | physics | 160610101 91 


1 
160610101| 刘 佳 19 | physics | 160610101| 2 | 87 
160610101| 刘 佳 19 | physics | 160610101| 3 | 88 
2 
3 





女 i 
女 2 
女 3 
160610102| 何 鹏 | 男 20 | network | 160610102 90 2 
160610102| 何 鹏 | 男 20 | network | 160610102 81 3 
NULL |NULLINULLINULL| NULL | NULL |NULL|NULL| 4 | 操作 系统 
NULL |NULLINULLINULL| NULL | NULL |NULLINULL| 5 
NULL |NULLINULLINULL| NULL | NULL |NULLINULL| 6 
NULL |NULLINULLINULL| NULL | NULL |NULLINULL| 7 
NULL |NULLINULLINULL| NULL | NULL |NULLINULL| 8 
160610103| 孙 晋 | 男 18 | computer| NULL |NULLINULLINULL| NULL |NULLINULL 


和 



































160610105| 张 慧 | 女 | 19 | database | NULL |NULL|NULLINULL| NULL |NULL|NULL 
其 关系 代数 表达 式 为 


student scJX course 
4. 除法 运算 


设 关系 尽 除 以 关系 S 的 结果 为 关系 T, 则 了 械 包 含 所 有 在 R 中 但 不 在 S 中 的 属性 及 其 
值 , 且 工 的 元 组 与 S 的 元 组 的 所 有 组 合 都 在 R 中 。 
给 定 关系 R(X,Y) 和 S(Y,2Z), 其 中 义 .Y、Z 为 属性 组 ,R 中 的 了 与 S 中 的 Y 可 以 有 
不 同 的 属性 名 ,但 必须 出 自 同一 个 域 .R 与 S 的 除 运算 得 到 一 个 新 关系 P(X),P 是 R 中 
满足 下 列 条 件 的 元 组 在 X 属性 列 上 的 投影 : 元 组 在 XX 上 分 量 值 x 的 象 集 Yz 包含 S 在 
上 投影 的 集合 , 记 作 : 
RS= {LX |i E RAIS) ESYz} 
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其 中 ,Yz 为 zx 在 R 中 的 象 集 ,z 一 上 LX]。 


除 运算 同时 从 行 和 列 的 角度 进行 运算 。 
【 例 3.28】 已 知 R 和 S.,R 二 S 的 值 如 图 3.14 所 示 。 























关系 S 
C B C D 
C> bl 全 dq 
b, G3 dl 
ce b. cl d. 
G 
和 RS 
ci 4 

al 











图 3.14 RS 


【 例 3. 29】 查询 至 少 选修 了 2 号 课程 和 3 号 课程 的 学 生 的 学 号 。 
首先 建立 一 个 临时 关系 了 : 

















然后 求 Haoeoo(sc) 二 下 

其 结果 为 160610101 学 生 和 160610102 学 生 选 了 这 两 门 课 。 

【 例 3.30】 查询 至 少 选修 了 一 门 其 直接 先 修 课 为 6 号 课程 的 学 生 姓 名 。 
Ilsname (Gcpno=e (COUrse) NM ScM Isno,sname (student)) 

【 例 3.31】 查询 选修 了 所 有 课程 的 学 生 的 学 号 和 姓名 。 


Isnoseno (SC) 二 [leno (Course) MIswo,smame (student) 


3.3.3 关系 代数 表达 式 应 用 举例 














基于 2. 3 节 的 公司 示例 数据 库 , 请 用 关系 代数 表达 式 查 询 如 下 问题 。 
(1) 查询 来 自 湖南 的 且 工 资 在 50000 以 下 的 员工 信息 。 
Gaddress 二 湖南 'h salary<==s0000 (employee) 
(2) 查询 王 安 所 在 的 部 门 名 。 
Janame (aname= 王 安 'employee Ls department) 
(3) 查询 李 丽 参与 的 所 有 项 目 编号 。 
Ilpwo (auame= 棕 画 'employee .P< works_on) 


(4) 查询 李 丽 参与 的 所 有 项 目 编号 及 项 目 名 字 。 


关系 代数 


Tpno, pname (Gname= 字 memployee .qd works_on pao ,es Project) 
(5) 查询 参与 了 所 有 项 目的 员工 的 社会 保险 号 。 
(Tlessn,pno Works_on) 二 (Tpnwmber project) 
(6) 查询 工资 在 50000 以 下 的 员工 姓名 及 部 门 名 。 
Ineanane (Osalary<=s0000 employee ,Cd department) 


dno= dnumber 
(7) 查询 没有 家 属 的 员工 的 信息 。 
(Ts employee — [lss, dependent) Memployee 


3.4 小 结 


本 章 介 绍 的 关系 数据 库 的 操作 包括 增 、 删 \ 改 、 查 ,讲述 的 关系 操作 的 语言 包括 关系 代 
数 语 言 . 元 组 演算 语言 . 域 演算 语言 SQL。 本 章 只 涉及 关系 代数 语言 , 它 是 抽象 的 操作 语 
言 , 包 含 传统 的 集合 运算 : 并 \ 交 、 差 . 笛 卡 儿 积 ,还 包含 专门 的 关系 运算 : 选择 ,投影 、 连 
接 ( 等 值 连接 ,不 等 值 连接 ,自然 连接 .外 连接 ) 及 除 运算 。 


3.5 习题 


. 为 什么 关系 代数 里 包含 传统 的 集合 运算 ? 

.两 个 关系 进行 并 、 交 、 差 运算 的 前 提 条 件 是 什么 ? 

. 什么 是 投影 运算 ? 什么 是 选择 运算 ? 举例 说 明 。 

. 什么 是 内 连接 ? 什么 是 外 连接 ? 举例 说 明 。 

5. 针对 2. 3 节 的 公司 数据 库 做 如 下 几 个 题目 ,请 用 关系 代数 表达 式 。 
(1) 查询 社会 保险 号 为 123456789 的 员工 的 姓名 及 部 门 编号 。 
(2) 查询 5 号 部 门 工资 在 50000 以 上 的 员工 信息 。 

(3) 查询 社会 保险 号 为 123456789 的 员工 的 所 在 部 门 名 。 

(4) 查询 社会 保险 号 为 123456789 的 员工 参与 的 所 有 项 目 编号 。 
(5) 查询 社会 保险 号 为 123456789 的 员工 参与 的 所 有 项 目 名 字 。 
(6) 查询 规划 处 的 部 门 地 址 。 

(7) 查询 参与 了 项 目地 址 在 天 津 的 项 目的 员工 编号 。 


上 co 性 
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| 第 2 篇 


设计 及 应 用 篇 


数据 库 设计 的 目的 是 设计 出 计算 机 可 以 处 理 的 数据 模型 ,如 层 
次 模型 \ 网 状 模型 .关系 模型 .面向 对 象 模型 。 在 本 书 中 ,我 们 主要 
指 关 系 模型 。 如 何 为 具体 的 业务 系统 设计 出 合适 的 数据 库 模型 是 
本 篇 的 任务 。 

数据 库 设计 有 很 多 种 方法 ,如 基于 E-R 模型 的 设计 方法 .3NF 
(第 三 范式 ) 的 设计 方法 .UML 建 模 方法 、 新 奥尔良 方法 。 

本 篇 涉及 的 内 容 有 以 下 章节 。 

第 4 章 使 用 实体 一 联系 模型 进行 数据 建 模 。 

第 5 章 扩展 的 实体 一 联系 模型 。 

第 6 章 实体 一 联系 模型 到 关系 模型 的 转换 。 

第 7 章 UML 类 图 建 模 。 

第 8 章 关系 数据 理论 。 

第 9 章 关系 数据 库 标 准 语言 SQL。 

第 10 章 ”数据库 编程 。 

第 11 章 ”数据库 设计 。 


第 4 章 使 用 实体 一 联系 模型 进行 数据 建 模 


利用 模型 对 事物 进行 描述 是 人 们 在 认识 改造 世界 过 程 中 广泛 采用 的 一 种 方法 ,如 汽 
车 、 飞 机 模型 等 。 模 型 可 更 形象 .直观 地 揭示 事物 的 本 质 特征 ,使 人 们 对 事物 有 一 个 更 全 
面 、 深 入 的 认识 ,从 而 帮助 人 们 更 好 地 解决 问题 。 

是 否 在 进行 数据 库 系 统 设计 时 也 可 以 利用 模型 来 帮助 我 们 完成 工作 呢 ? 如 果 可 以 ， 
那么 利用 何 种 模型 呢 ? 

因此 ,进行 数据 库 系 统 设 计时 也 可 以 利用 模型 来 帮助 我 们 完成 工作 。 针 对 业务 系统 的 
信息 需求 建立 模型 ,可 以 帮助 人 们 更 好 地 理解 业务 系统 对 数据 的 需求 以 及 对 数据 的 处 理 。 


4.1 数据 模型 


如 同 在 建筑 设计 和 施工 的 不 同 阶段 需要 不 同 的 图 纸 一 样 ,在 开发 实施 数据 库 应 用 系 
统 的 不 同 阶段 也 要 用 到 不 同 的 数据 模型 。 

数据 库 中 有 3 类 数据 模型 ,这 3 类 数据 模型 分 别 在 开发 实施 数据 库 应 用 系统 的 3 个 
阶段 中 使 用 。 第 一 类 是 概念 模型 ,在 开发 的 第 一 阶段 中 使 用 ;第 二 类 为 逻辑 模型 ,在 开发 
的 第 二 阶段 中 使 用 ;第 三 类 是 物理 模型 ,在 开发 的 第 三 阶段 中 使 用 。 

本 童 前 面 介绍 的 关系 数据 模型 属于 人 逻辑 模型 。 逻 辑 模 型 包括 层次 数据 模型 .网 状 数 
据 模型 .面向 对 象 数据 模型 对象 关系 数据 模型 、 半 结构 化 数据 模型 等 。 逻 辑 模 型 是 按照 
计算 机 系统 的 观点 对 数据 建 模 。 也 就 是 说 ,数据 库 管理 系统 是 基于 逻辑 模型 实现 的 。 这 
类 数据 模型 一 般 包 含 3 个 方面 : 数据 结构 ,数据 约束 、 数 据 操作 。 前 面 的 关系 数据 模型 的 
数据 结构 是 关系 ( 表 ) ,操作 有 增 、 删 . 改 、 查 ,完整 性 约束 有 实体 完整 性 ,参照 完整 性 和 用 户 
自 定义 完整 性 。 

而 概念 模型 是 从 用 户 的 角度 对 现实 世界 进行 建 模 ,用 于 数据 库 设 计 的 第 一 阶段 。 

物理 模型 则 是 对 数据 的 最 底层 抽象 , 它 描述 数据 在 系统 内 部 的 表示 方式 和 存 取 方法 ， 
即 数据 在 磁盘 或 磁带 上 的 存储 方式 和 存 取 方法 。 物 理 模型 的 具体 实现 是 DBMS 的 任务 ， 
数据 库 设 计 人 员 要 了 解 和 选择 物理 模型 。 








4.2 概念 模型 


为 了 能 把 现实 世界 的 具体 事物 抽象 组 织 为 某 个 DBMS 支持 的 数据 模型 ,首先 需要 对 
这 一 管理 活动 涉及 的 各 种 资料 数据 及 其 关系 有 一 个 全 面 且 清晰 的 认识 ,这 就 需要 收集 资 
料 . 了 解 用 户 需求 ,进行 详细 的 需求 分 析 , 然 后 采用 概念 模型 来 描述 。 对 现实 世界 建立 模 
型 , 既 要 能 准确 地 反映 现实 世界 ,又 能 容易 被 人 们 看 懂 ,方便 交流 ,这 个 过 程 为 建立 概念 模 
型 。 概 念 模型 一 般 用 于 人 员 之 间 的 交流 。 


数据 库 原理 及 应 用 


数据 库 的 设计 过 程 是 首先 将 现实 世界 抽象 为 信息 世界 ,然后 将 信息 世界 转换 为 机 器 世 
界 。 也 就 是 说 ,数据 模型 的 建立 过 程 是 : 从 现实 世界 抽 
象 出 信息 世界 的 概念 模型 ,再 由 概念 模型 转化 成 可 以 由 
计算 机 支持 的 数据 模型 (关系 模型 .层次 模型 、 网 状 模型 、 
面向 对 象 模型 ,这 里 指 的 是 关系 模型 ) ,如 图 4. 1 所 示 。 

因此 ,设计 数据 库 以 及 开发 数据 库 应 用 系统 ,首先 
需要 建立 的 是 概念 模型 。 信息 世界 : 概念 模型 

设计 数据 库 系统 时 ,一般 先 用 图 或 表 的 形式 抽象 地 
反映 数据 彼此 之 间 的 关系 ,这 一 过 程 称 为 建立 数据 
模型 。 trem Devs 支持 的 下 所 型 

本 章 主要 介绍 如 何 建立 概念 模型 。 概 念 模型 的 方法 
有 很 多 种 ,主要 有 实体 一 联系 模型 (Entity Relationship 图 4.1 数据 模型 的 建立 过 程 
Model,E-R 模型 ) 法 .扩展 的 实体 一 联系 模型 (Extended E-R Model,EER 模型 ) 法 .UML 类 
图 法 .对 象 定义 语言 (Object Definition Language,ODL) 法 等 。 其 中 ,使 用 最 广泛 的 是 1976 年 
P. P.S Chen 提出 用 实体 一 联系 模型 (E-R 模型 ) 法 来 表示 概念 模型 。 


4.3 实体 一 联系 模型 


在 实体 一 联系 模型 中 ,认为 现实 世界 是 由 实体 .属性 及 实体 间 的 联系 构成 的 。 一 般 
地 ,实体 一 联系 模型 用 E-R 图 (Entity Relationship Diagram,ERD) 来 表示 。 











转换 














4.3.1 基本 概念 


(1) 实体 : 是 现实 世界 中 实 实在 在 存在 的 事物 ,彼此 之 间 相互 区 别 。 例 如 ,学 生 、 教 
师 . 教 室 汽车. 工作、 课程 等 。 实 体 也 有 可 能 是 抽象 的 概念 ,如 学 生 的 选课 .比赛 ,部 门 的 
订货 等 。 

(2) 实体 集 : 同 种 类 型 实体 的 集合 。 例 如 ,全 体 教 职 工 就 是 一 个 实体 集 , 又 如 全 部 课 
程 . 全 体 学 生 、 全 体 员工 等 。 

(3) 实体 型 : 同一 类 型 实体 。 例 如 ,学 生 类 型 实体 属于 学 生 实体 型 ,表示 为 : 学 生 ( 学 
号 ,姓名 ,年 龄 ,性 别 , 专 业 )。 在 E-R 图 中 用 矩形 表示 ,如 图 4.2 所 示 。 

(4) 属性 : 描述 实体 某 方面 的 性 质 。 例 如 ,学 生 实体 的 属性 有 学 号 、 姓 名 等 ,教师 实 
体 的 属性 有 教 职 工 编号 姓名、 职称 、 专 业 等 ,如 果 还 需要 描述 教师 的 工资 信息 ,可 以 增加 
一 个 属性 “薪水 ”。 每 个 属性 都 有 一 个 具体 的 值 , 取 自 一 个 值 域 , 如 整 型 .实数 .字符 串 等 ; 
例如 , 刘 佳 同学 的 性 别 为 * 男 "。 在 ER 图 中 ,用 椭圆 表示 属性 ,如 图 4.3 所 示 。 


CE 


图 4.2 实体 的 表示 图 4.3 属性 的 表示 











学 生 学 生 
































使 用 实体 一 联系 模型 进行 数据 建 模 


属性 又 分 为 如 下 4 类 。 

O 简单 属性 : 是 属性 中 最 简单 的 一 类 ,这 类 属性 的 取 值 不 可 再 分 ,如 年 龄 ,性别 工资 等 。 

@ 复合 属性 : 属性 由 几 部 分 组 成 ,例如 ,学 生 实 体 的 家 庭 住址 是 复合 属性 ,由 省 \ 市 、 
区 ,街道 地 址 构成 ,而 街道 地 址 又 由 街道 名 、 小 区 、 门 牌号 组 成 ,如 图 4.4 所 示 。 





4.4 复合 属性 “地 址 ” 


@ 多 值 属性 : 对 应 于 一 个 具体 实体 , 它 的 属性 值 有 多 个 。 例 如 ,学 生 的 学 位 可 能 是 
双 学 位 ,车 子 的 颜色 可 能 有 多 种 ,人 的 电话 号 码 可 能 有 多 个 。 多 值 属性 用 双 椭 圆 表示 ,如 
图 4.5 所 示 。 

@ 衍生 属性 : 其 值 可 由 其 他 属性 值 推导 出 来 。 例 如 ,学 生 的 年 龄 可 以 由 学 生 的 出 生 
年 月 推导 出 来 。 衍 生 属性 用 虚线 椭圆 表示 ,如 图 4.6 所 示 。 

(5) 联系 : 分 为 实体 型 内 部 的 联系 和 实体 型 之 间 的 联系 。 例 如 ,学 生 和 教师 两 类 实 
体型 之 间 存在 学 与 教 的 联系 ,学 生 和 课程 实体 型 之 间 存在 选修 的 联系 ,学 生 与 学 生 同 类 型 
实体 之 间 也 存在 联系 等 。 实 际 上 , 当 一 个 实体 引用 另 一 个 实体 进行 描述 时 ,那么 这 两 个 实 
体 之 间 就 存在 联系 。 例 如 ,每 个 部 门 都 有 多 个 员工 ,表示 部 门 实体 和 员工 实体 之 间 有 联 
系 。 联 系 在 E-R 图 中 用 菱形 表示 ,如 图 4.7 所 示 , 中 间 为 联系 的 名 字 。 参 与 联系 的 实体 
都 充当 了 一 定 的 角色 。 例 如 ,学 生 和 教师 之 间 的 联系 ,学 生 实体 充当 学 习 的 角色 ,教师 实 
体 充当 教学 的 角色 。 


SN 
—C ) NS 联系 名 
图 4.5 多 值 属性 的 表示 图 4.6 衍生 属性 的 表示 图 4.7 联系 的 表示 


两 类 实体 型 之 间 存 在 着 多 种 联系 类 型 , 叫 作 基数 比 ,分 为 一 对 一 (1 : 1) 一 对 多 (1 : 
nn) ,多 对 多 (n : m) 等 多 种 类 型 。 

g@ 一 对 一 联系 : 对 于 实体 集 A 中 的 每 个 实体 ,最 多 只 能 和 实体 集 B 中 的 一 个 实体 有 
联系 ;反之 ,对 于 实体 集 B 中 的 每 个 实体 ,最 多 只 能 和 实体 集 A 中 的 一 个 实体 有 联系 。 

例如 ,一 个 班级 对 应 一 个 班长 ,一 个 班长 只 能 管理 一 个 班级 ,如 图 4.8 所 示 。 


班级 > 班长 


4.8 班长 与 班级 之 间 的 管理 联系 
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又 如 ,一 个 部 门 对 应 一 个 经 理 ,一 个 经 理 只 能 管理 一 个 部 门 ,如 图 4. 9 所 示 。 


部 站 1 1 经 理 


图 4.9 经 理 与 部 门 之 间 的 管理 联系 





























@ 一 对 多 联系 : 对 于 实体 集 A 中 的 每 个 实体 ,最 多 能 和 实体 集 B 中 的 多 个 实体 有 联 
系 ;反之 ,对 于 实体 集 B 中 的 每 个 实体 ,最 多 只 能 和 实体 集 A 中 的 一 个 实体 相 联 系 。 
例如 ,一 个 班级 对 应 多 个 学 生 , 一 个 学 生 只 能 属于 一 个 班级 ,如 图 4. 10 所 示 。 


mm | > 学 生 


图 4. 10 班级 与 学 生 之 间 的 所 属 联系 


























又 如 ,一 个 部 门 有 多 个 员工 ,一 个 员工 只 能 属于 一 个 部 门 等 。 

@ 多 对 多 联系 : 对 于 实体 集 A 中 的 每 个 实体 ,最 多 能 和 实体 集 B 中 的 多 个 实体 有 联 
系 ;反之 ,对 于 实体 集 B 中 的 每 个 实体 ,最 多 能 和 实体 集 A 中 的 多 个 实体 有 联系 。 

例如 ,学 生 和 课程 之 间 的 联系 ,学 生 可 以 选修 多 门 课 程 ,一 门 课程 也 可 以 由 多 个 学 生 
选修 ,如 图 4.11 所 示 。 


























图 4.11 选修 联系 


又 如 ,一 个 教师 可 以 教授 多 门 课程 ,一 门 课程 可 以 由 多 个 教师 讲授 。 

注意 : 联系 的 基数 比 的 判断 是 根据 现实 世界 的 规定 进行 确定 。 例 如 ,教师 和 课程 之 
间 的 基数 比 可 以 有 多 种 类 型 ,表示 不 同 的 应 用 环境 需求 。 

@ 教师 与 课程 之 间 是 1 : 1 的 联系 ,表示 一 个 教师 最 多 可 以 教 一 门 课程 ,一 门 课程 最 
多 由 一 个 教师 教 ,如 图 4. 12 所 示 。 


教师 ! ! 课程 


图 4.12 教师 与 课程 之 间 1 : 1 的 联系 


























@ 教师 与 课程 之 间 是 1 : n 的 联系 ,表示 一 个 教师 可 以 教 多 门 课程 ,一 门 课程 最 多 只 
能 由 一 个 教师 教 ,如 图 4. 13 所 示 。 

@ 教师 和 课程 之 间 是 n: 1 的 联系 ,表示 一 个 教师 最 多 可 以 教 一 门 课程 ,一 门 课程 可 
以 由 多 个 教师 教 ,如 图 4.14 所 示 。 

@ 教师 和 课程 之 间 是 n: m 的 联系 ,表示 一 个 教师 可 以 教 多 门 课程 ,一 门 课程 可 以 
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教师 1 Cn > 1 课程 


4.13 教师 与 课程 之 间 1 : ”的 联系 


教师 2 ! 课程 


图 4.14 教师 与 课程 之 间 n: 1 的 联系 
































由 多 个 教师 教 , 如 图 4. 15 所 示 。 


教师 下 课程 


图 4.15 教师 与 课程 之 间 n: m 的 联系 


























注意 : 具体 采用 哪 种 联系 ,根据 现实 情况 确定 。 

实际 上 ,与 实体 型 .实体 集 、 实 体 这 几 个 概念 对 应 ,联系 也 有 联系 的 型 .联系 集 、 联 系 ， 
表示 联系 的 型 , 集 、 值 ,这 里 统称 联系 ,不 再 展开 叙述 。 

(6) 联系 的 度 : 参与 联系 的 实体 型 的 个 数 。 参 与 联系 的 实体 型 只 有 一 类 , 叫 作 一 元 
联系 ,例如 ,学 生 和 班长 之 间 的 联系 ,学 生 属 于 学 生 实 体型 ,班长 同样 也 属于 学 生 实体 型 ， 
因此 它 是 一 元 联系 ,如 图 4. 16 所 示 。 参 与 联系 的 实体 型 有 两 类 , 叫 作 二 元 联系 。 前 面 介 
绍 的 都 是 二 元 联系 。 参 与 联系 的 实体 型 有 三 类 , 叫 作 三 元 联系 ,图 4. 17 所 示 是 教师 .课程 
及 学 生 三 类 实体 之 间 的 三 元 联系 ,表示 一 个 教师 可 以 为 多 个 学 生 教授 多 门 课程 ;一 门 课程 
可 以 由 多 个 老师 教授 给 多 个 学 生 ;一 个 学 生 可 以 学 习 多 个 教师 教授 的 多 门 课程 。 参 与 联 
系 的 实体 型 有 多 类 , 叫 作 多 元 联系 。 


学 生 


图 4.16 学 生 实体 内 的 一 元 联系 








教师 




















学 生 课程 




















图 4.17 学 生 ` 教 师 . 课 程 之 间 的 三 元 联系 
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(7) 联系 上 的 属性 : 联系 上 也 可 以 有 属性 。 如 图 4. 18 所 示 , 学 生 实体 和 课程 实体 之 间 
的 选修 联系 ,其 成 绩 属 性 的 位 置 应 该 放 在 联系 上 。 因 为 单独 的 学 生 实体 无 法 决定 成 绩 ,单独 
的 课程 实体 也 无 法 决定 成 绩 ,只 能 由 学 生 和 课程 共同 决定 某 个 学 生 某 门 课程 成 绩 的 取 值 。 


学 生 n < > m | 课程 


图 4.18 选修 联系 


























(8) 联系 的 参与 约束 : 分 为 完全 参与 和 部 分 参与 两 种 。 没 有 特别 指明 ,也 可 不 模拟 
完全 参与 和 部 分 参与 。 

@ 完全 参与 : 实体 集中 的 每 一 个 实体 都 参与 了 联系 。 用 双 线 表示 。 

每 个 员工 都 必须 属于 一 个 部 门 ,每 个 部 门 必须 至 少 有 一 个 员工 ,部 门 和 员工 都 是 完全 


参与 ,如 图 4. 19 所 示 。 
1 mn 
部 站 员工 


图 4. 19 完全 参与 约束 
































@ 部 分 参与 : 实体 集中 只 有 部 分 实体 参与 联系 ,用 单线 表示 。 
例如 ,员工 中 只 有 一 个 人 (主要 指 部 门 经 理 ) 可 以 管理 部 门 , 每 个 部 门 必须 被 管理 , 员 
工 为 部 分 参与 ,部 门 为 完全 参与 ,如 图 4. 20 所 示 。 


1 1 
部 门 员工 


图 4.20 ”部 分 参与 约束 


























(9) 弱 实 体 : 不 能 单独 存在 的 实体 。 弱 实体 必须 依附 于 其 他 实体 之 上 存在 ,被 依附 
的 实体 称 为 强 实 体 。 例 如 ,在 一 个 人 事 管理 系统 中 ,家 属 这 样 的 实体 不 能 单独 存在 ,必须 
依附 于 职工 实体 ,因为 一 旦 职工 离开 公司 ,家 属 也 跟着 离开 。 弱 实体 一 般 都 是 完全 参与 ， 
用 双 和 矩形 表 示 ,其 对 应 的 联系 用 双 萎 形 表示 。 弱 实体 的 键 由 本 身 的 部 分 键 及 所 依附 的 强 
实体 的 主键 共同 组 成 。 家 属 弱 实体 如 图 4. 21 所 示 。 


4.3.2 一 个 完整 的 示例 


下 面 举 一 个 具体 的 例子 : 先 给 出 某 公司 的 数据 库 需求 分 析 ,再 给 出 相应 的 ER 图 ,第 
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图 4.21 家 属 弱 实体 


5 一 6 章 和 第 9 章 都 会 用 到 这 个 例子 。 公 司 的 数据 库 里 记录 了 公司 的 职工 信息 .部门 信息 
以 及 项 目 信息 。 该 公司 的 需求 分 析 说 明 如 下 。 

公司 由 多 个 部 门 组 成 ,每 个 部 门 有 唯一 的 名 称 、 编 号 ,以 及 一 个 职工 负责 管理 这 个 部 
门 ,数据 库 中 记录 了 他 管理 这 个 部 门 的 开始 时 间 ,一 个 部 门 可 能 有 多 个 地 址 。 

每 个 部 门 管理 一 些 项 目 , 每 个 项 目 都 有 唯一 的 名 称 、 编 号 及 地 址 。 

数据 库 中 保存 了 每 个 职工 的 名 字 、 社 会 保险 号 地址. 工资. 性别 及 出 生日 期 。 每 个 职 
工 都 属于 一 个 部 门 ,可 能 参与 了 多 个 项 目 ,这 些 项 目 不 一 定 由 职工 所 在 的 部 门 管理 ,我 们 
记录 了 每 个 职工 参与 每 个 项 目的 小 时 数 ,还 记录 了 每 个 职工 的 直接 管理 者 。 

数据 库 中 保存 了 每 个 职工 的 家 属 信息 ,记录 了 每 个 家 属 的 名 字 、 性 别 . 出 生日 期 以 及 
和 职工 的 关系 。 

这 个 公司 数据 库 的 E-R 图 如 图 4. 22 所 示 。 









































图 4.22 公司 数据 库 的 E-R 


对 该 E-R 图 说 明 如 下 。 





63 











数据 库 原理 及 应 用 


1. 实体 及 属性 信息 


该 公司 数据 库 中 主要 记录 了 职工 、 部 门 、 项 目 实体 信息 。 

职工 实体 的 属性 包括 社会 保险 号 名字、 性 别 . 地 址 .工资 .出 生日 期 。 职 工 实体 的 名 
字 属 性 是 一 个 组 合 属性 ,由 姓 和 名 构成 ,这 里 考虑 为 简单 属性 。 

部 门 实体 的 属性 包括 部 门 名 称 、 编 号 ,地址 。 由 于 部 门 的 地 址 有 多 个 ,所 以 部 门 地 址 
为 多 值 属性 。 每 个 部 门 的 员工 数量 是 衍生 属性 ,可 以 由 职工 信息 推导 出 来 。 部 门 名 称 和 
编号 唯一 。 

项 目 实体 的 属性 包括 名 称 、 编 号 .地 址 。 这 里 的 地 址 为 简单 属性 。 项 目的 名 称 和 编号 
唯一 。 


2. 二 元 联系 及 其 属性 


部 门 和 职工 之 间 有 两 种 不 同 的 联系 ,一 种 是 1 : 1 的 管理 联系 ,在 此 联系 上 有 属性 “ 开 
始 时 间 ”, 表 示 一 个 领导 何 时 开始 管理 部 门 ,在 管理 联系 中 ,部 门 实体 是 完全 参与 ,而 职工 
是 部 分 参与 。 

部 门 和 职工 之 间 还 存在 另 一 种 1 : ?的 联系 ,表示 每 个 职工 属于 某 个 部 门 ,而 某 个 部 
门 有 多 个 职工 。 

部 门 与 项 目 之 间 存 在 1 : n 的 管理 联系 ,项 目 实体 为 完全 参与 。 

每 个 职工 有 一 个 直接 管理 者 ,因此 职工 实体 内 部 之 间 存 在 1 : n 的 管理 联系 。 

职工 参与 项 目 ,表示 职工 与 项 目 之 间 存 在 n: m 的 联系 ,职工 参与 每 个 项 目 花 费 的 时 
间 不 一 样 ,因此 ,“ 小 时 数 ” 属 性 应 该 放 在 参与 联系 上 。 


3. 弱 实 体 

在 本 例 中 ,家 属 ? 为 弱 实 体 , 即 当 职工 离开 公司 时 ,其 家 属 的 信息 一 并 删除 。 因 此 , 职 
工 是 家 属 的 强 实体 。 家 属实 体 的 属性 包括 名 字 、 性 别 . 出 生日 期 ,和 职工 的 关系 。 
4.3.3 E-R 图 表示 法 小 结 

E-R 图 表示 法 总 结 如 图 4. 23 所 示 。 


4.3.4 联系 的 不 同 表 示 法 


联系 的 另 一 种 表示 方法 是 最 小 最 大 (min : max) 表 示 法 ,min 和 max 都 为 整数 (0 三 
min<max, max 宇 1), 它 表示 在 联系 RR 中 ,实体 型 E 中 的 每 个 实体 最 少 与 对 方 min 个 实体 
发 生 联系 ,最 多 与 对 方 max 个 实体 发 生 联系 。 

例如 ,图 4. 24 表示 一 个 部 门 最 多 由 一 个 职工 管理 ,最 少 也 由 一 个 职工 管理 ,一 个 职工 
最 少 管理 0 个 部 门 ,最 多 只 能 管理 1 个 部 门 。 

又 如 ,图 4. 25 表示 一 个 职工 最 少 为 一 个 部 门 工作 ,最 多 为 一 个 部 门 工作 ;一 个 部 门 最 
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[本 | < > 避 ] 在 联系 R 中 ， 实 体 B2 完 全 参与 
KR> 在 联系 R 中 ，E1 和 BE2 的 基数 比 为 1 :m 


实体 E 参 与 联系 R 的 (最 小 ， 最 大 ) 表 示 法 


图 4.23 E-R 图 表示 法 总 结 


职工 (0,1) (TD 部 站 


4.24 职工 部 门 管理 联系 的 最 小 最 大 表示 法 


























少 有 一 个 职工 ,最 多 由 多 个 职工 组 成 。 


I en >| 各 


图 4.25 职工 部 门 工作 联系 的 最 小 最 大 表示 法 


























在 最 小 最 大 表示 法 中 , 当 min 一 0 时 表示 部 分 参与 , 当 min0 时 表示 完全 参与 。 最 
小 最 大 表示 法 蕴涵 了 联系 的 基数 比 ,又 蕴涵 了 联系 的 参与 约束 ,而 且 表 达 得 更 精确 。 

公司 数据 库 E-R 图 的 最 小 最 大 表示 法 如 图 4. 26 所 示 。 

在 该 ER 图 中 ,职工 和 部 门 之 间 的 管理 联系 表示 为 : 一 个 部 门 最 少 由 一 个 职工 管理 ， 
最 多 也 由 一 个 职工 管理 ;一 个 职工 最 多 可 以 管理 一 个 部 门 。 而 职工 和 部 门 之 间 的 “工作 ” 
联系 ,表示 一 个 部 门 最 少 由 4 个 职工 组 成 ,最 多 可 以 由 多 个 职工 组 成 ;一 个 职工 最 少 工作 
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图 4.26 公司 数据 库 E-R 图 的 最 小 最 大 表示 法 


一 个 部 门 ,最 多 只 工作 于 一 个 部 门 。 部 门 和 项 目 之 间 的 联系 表示 为 : 一 个 部 门 可 以 管 
理 多 个 项 目 , 也 可 以 没有 项 目 , 而 一 个 项 目 至 少 由 一 个 部 门 管理 ,最 多 也 只 能 由 一 个 部 门 
管理 。 


4.4 E-R 图 应 用 举例 


学 校 有 若干 个 系 ,每 个 系 有 若干 个 班级 和 教研 室 ,每 个 教研 室 有 若干 个 教员 ,其 中 有 
的 教授 和 副教授 各 带 若干 个 研究 生 。 每 个 班级 有 若干 个 学 生 ,每 个 学 生 选 修 若干 门 课程 ， 
每 门 课 程 可 由 若干 个 学 生 选 修 。 用 E-R 图 画 出 该 校 的 概念 模型 ,如 图 4. 27 所 示 。 

在 该 需求 分 析 中 主要 提 到 的 实体 有 班级 教研室、 教员 学生、 课程 . 系 ;其 中 只 有 教授 
和 副教授 才 可 以 带 若 干 个 研究 生 , 可 以 对 实体 “教员 "设置 属性 “职称 ?来 表示 是 否 有 资格 
指导 研究 生 ; 同 样 ,研究 生 是 学 生 中 的 一 部 分 ,还 存在 本 科 生 ,因此 可 以 设置 属性 “学 历来 
表示 学 生 的 类 型 。 如 果 一 句 话 中 涉及 多 个 实体 , 那 就 表示 这 几 个 实体 有 联系 。 例 如 ,每 个 
教研 室 有 若干 教员 ,表示 实体 教研 室 与 实体 教员 存在 联系 ,如 果 需 求 说 明 书 中 没有 明确 指 
出 联系 的 类 型 ,我 们 就 根据 现实 生活 中 的 一 般 情况 来 标注 联系 的 类 型 。 例 如 ,每 个 教研 室 
有 若干 个 教员 ,根据 一 般 情况 ,教研 室 和 教员 之 间 为 1 : n 的 联系 ;类 似 地 ,每 个 系 有 若干 
班级 也 表示 系 与 班级 之 间 为 1 : n 的 联系 。 

E-R 图 没有 唯一 答案 ,根据 需求 分 析 说 明 书 ,不 同 的 设计 人 员 模拟 出 的 ER 图 经 常 
不 同 , 要 求 能 够 准确 地 说 明 需 求 。 
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课程 讲授 
图 4.27 学 校 E-R 图 
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本 章 介绍 了 数据 模型 的 分 类 : 概念 模型 、. 逮 辑 模型 、 物 理 模型 ,并 介绍 了 概念 模型 在 
数据 库 设计 中 的 作用 。 概 念 模型 最 流行 的 表示 法 为 E-R 图 表示 法 。 概 念 模型 把 现实 世 
界 的 所 有 对 象 抽象 为 实体 、 属 性 、 联 系 。 本 章 详 细 地 对 E-R 图 中 的 基本 概念 进行 了 描述 ， 
并 给 出 了 一 个 具体 的 数据 库 例子 。 


4.6 习题 


本 


. 简 述 3 类 数据 模型 。 
. 简 述 以 下 概念 : 实体 、 实 体型 .实体 集 、 属 性 ,多 值 属 性 联系、 弱 实 体 。 

nvn: m、 联 系 的 角色 一 元 联系 、 多 元 联系 。 
. 在 物资 管理 中 ,一 个 供应 商 为 多 个 项 目 供应 多 种 零件 ,一 种 零件 只 能 保存 在 一 个 


. 简 述 联系 的 基数 比 .1: 1、1: 


仓库 中 ,一 个 仓库 中 可 保存 多 种 零件 ,一 个 仓库 有 多 名 员工 值班 ,由 一 个 员工 负责 管理 。 
画 出 该 物资 管理 系统 的 E-R 图 。 

5. 在 课程 管理 系统 中 ,涉及 班级 .学 生 、 课 程 . 教 师 、 参 考 书 等 实体 。 假 设 一 个 教师 
只 可 上 一 门 课程 ,一 门 课程 可 由 多 个 教师 讲授 ,可 使 用 多 本 参考 书 , 请 画 出 该 系统 的 


E-R 图 。 
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第 5 章 扩展 的 实体 一 联系 模型 


进行 传统 的 数据 库 应 用 系统 开发 时 ,第 4 章 学 的 E-R 模型 已 经 足够 使 用 ;但 是 ,如 果 
涉及 一 些 工 程 设计 、 制 造 业 (CAD/CAM) 电信、GIS 及 其 他 复杂 的 软件 系统 时 ,E-R 模型 
就 不 能 很 好 地 模拟 和 表达 这 些 复杂 的 概念 了 ,因此 ,为 了 更 好 地 模拟 现实 世界 中 的 复杂 情 
况 , 在 E-R 模型 的 基础 上 扩展 了 一 些 新 的 内 容 , 这 就 是 本 章 要 讨论 的 EER 模型 。 


5.1 扩展 的 实体 一 联系 模型 介绍 


扩展 的 实体 一 联系 模型 (Enhanced-ER Model,EER) 也 称 增强 的 实体 一 联系 模型 。 
除了 包含 基本 的 E-R 模型 概念 ,EER 模型 增加 了 子 类 、 超 类 ( 父 类 ) ,、 特 化 、 概 化 ,用 来 模拟 
更 加 复杂 或 者 更 加 精确 的 应 用 ,同时 还 增加 了 面向 对 象 的 概念 ,如 继承 ,并 用 聚集 表示 联 
系 之 间 的 联系 。 














5.1.1 扩展 的 E-R 模型 的 基本 概念 


1. 父 类 ( 超 类 )/ 子 类 


我 们 经 常会 碰 到 某 些 实体 型 是 某 类 实体 型 的 子 类 型 , 即 某 实体 型 有 一 些 不 同意 义 的 
分 组 ,例如 ,员工 实体 型 可 以 分 为 秘书 \ 工 程 师 ,技术 员 。 每 个 分 组 都 是 员工 实体 型 的 子 
集 ,每 个 分 组 叫 作 员工 的 子 类 。 而 员工 实体 型 则 称 为 父 类 或 者 超 类 ,用 一 个 三 角形 来 表示 
这 种 父 类 / 子 类 关系 ,如 图 5. 1 所 示 , 其 中 ,d 表示 子 类 实体 不 相交 , 即 一 个 员工 如 果 是 秘 
书 ,就 不 能 同时 从 事 技术 员 的 工作 。 又 如 ,学 生 实体 里 有 本 科 生 实体 和 研究 生 实体 ,学 生 























打字 速度 技术 级 别 工程 师 类 型 
秘书 技术 员 工程 师 























图 5.1 员工 类 实体 的 3 个 子 类 型 
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实体 为 父 类 ,本 科 生 和 研究 生 为 子 类 ,如 图 5. 2 所 示 。 父 类 实体 划分 成 多 个 子 类 的 过 程 叫 
作 特 殊 化 ,简称 特 化 。 实 体 的 特 化 可 能 是 根据 某 个 属性 进行 划分 的 ,例如 ,根据 员工 的 属 
性 “工作 类 型 ?划分 ,员工 分 为 3 类 ;根据 学 生 实体 的 属性 “学 生 类 别 ? 划 分 ,学 生 分 为 研究 
生 实体 和 本 科 生 实体 。 


姓名 年 龄 





学 生 


学 号 学 生 类 别 


研究 生 本 科 生 











导师 姓名 


图 5.2 学 生 的 两 个 子 类 型 和 分 类 属性 


























同样 的 实体 型 其 特 化 的 方式 可 能 存在 多 种 。 例 如 ,员工 实体 又 可 以 根据 工资 付款 方 
式 特 化 为 小 时 工 、 受 雇员 工 , 如 图 5. 3 所 示 。 


名 字 地 址 


员工 























受 雇员 工 小 时 工 




















图 5.3 员工 类 实体 的 两 个 子 类 型 


为 什么 需要 子 类 与 父 类 呢 ? 

(1) 有 些 属性 不 是 所 有 的 子 类 都 具备 。 

(2) 不 是 所 有 实体 都 和 其 他 实体 具备 相同 的 联系 。 
2. 继承 


子 类 继承 父 类 的 所 有 属性 ,并 有 自己 特殊 的 属性 。 
例如 ,员工 实体 的 每 个 子 类 继承 了 员工 实体 的 所 有 属性 ,还 有 本 身 特殊 的 属性 。 子 类 
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秘书 继承 了 员工 实体 的 所 有 属性 ,包括 姓名 、 社 保 号 .出 生日 期 .地址 .工作 类 型 ,还 有 特殊 
属性 “打字 速度 ”。 


3. 不 相交 约束 


不 相交 约束 是 指 子 类 实体 不 相交 , 即 父 类 中 的 一 个 实体 最 多 只 能 属于 一 个 子 类 ,使 用 
字母 4 表示 不 相交 。 而 如 果 父 类 的 一 个 实体 可 以 属于 多 种 子 类 ,那么 子 类 实体 就 是 相交 
的 、 重 番 的 ,用 字母 o 表示 。 员 工 中 的 一 个 实体 只 能 属于 子 类 中 的 某 一 类 实体 ,如 图 5. 1 
和 图 5. 3 所 示 ; 类 似 地 ,学 生 中 的 每 个 实体 只 能 属于 子 类 中 的 某 一 类 实体 ,如 图 5. 2 所 示 ， 
应 该 在 三 角形 中 添加 字母 d 表示 子 类 不 相交 。 如 图 5. 4 所 示 , 父 类 实体 “人 ” 既 有 可 能 是 


员工 ,又 有 可 能 是 校友 。 























员工 校友 


5.4 实体 人 的 几 个 子 类 ,不 相交 约束 及 完备 性 约束 


























4. 完备 性 约束 


完备 性 约束 是 指 完全 约束 和 部 分 约束 。 

(1) 完全 约束 是 指 父 类 中 的 实体 必须 属于 子 类 中 的 一 类 ,用 双 竖 线 表示 ,如 图 5.4 所 
示 , 实 体 人 要 么 属于 实体 员工 ,要 么 属于 实体 学 生 , 要 么 属于 校友 。 如 图 5. 1 中 ,员工 实体 
中 的 员工 要 么 是 秘书 ,要 么 是 工程 师 ,要 么 是 技术 员 。 又 如 图 5. 3 所 示 , 员 工 实体 要 么 是 
小 时 工 ,要 么 是 受 雇 员工 。 

(2) 部 分 约束 是 指 可 以 允许 父 类 中 的 实体 不 属于 任何 子 类 ,用 单 竖 线 表示 。 如 图 5.2 
所 示 ,学 生 类 实体 中 有 的 学 生 既 不 属于 本 科 生 ,也 不 属于 研究 生 , 有 可 能 属于 专科 生 。 

没有 特别 要 求 , 也 可 不 画 出 完备 性 约束 。 
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5. 二 元 联系 与 三 元 联系 的 区 别 
如 图 5.5 所 示 , 供 应 商 、 项 目 、 零 件 的 三 元 联系 表示 供应 商 供应 项 目 零 件 。 








供应 商 








m 


p n 











项 目 零件 
图 5.5 供应 商 \ 项 目 、 零 件 的 三 元 联系 











供应 商 \ 项 目 、 零 件 3 个 实体 之 间 的 二 元 联系 如 图 5. 6 所 示 ,与 之 前 的 三 元 联系 具有 
不 同 的 语义 ,表示 供应 商 与 项 目 、 供 应 商 与 零件 、 项 目 与 零件 两 两 实体 之 间 的 联系 。 
































供应 商 2 供应 全 项 目 
m m 
Cea> Can> 
n p 
零件 











5.6 供应 商 、 项 目 . 零 件 3 个 实体 之 间 的 二 元 联系 


类 似 地 ,多 元 联系 与 实体 之 间 相 互 的 两 两 之 间 的 联系 表达 了 不 同 的 意思 ,根据 具体 的 
应 用 环境 选择 符合 应 用 要 求 的 联系 类 型 。 


6. 聚集 


聚集 是 一 种 特殊 的 联系 , 它 指 的 是 联系 之 间 的 联系 。 如 图 5.7 所 示 ,在 很 多 情况 下 ， 
部 门 经 理 对 本 部 门 职工 的 工作 情况 进行 管理 “管理 "这 个 联系 发 生 在 经 理 及 一 个 聚合 体 
上 ,这 个 聚合 体 表 示 职 工 在 部 门 工作 的 情况 。 一 个 职工 在 一 个 具体 的 部 门 做 一 个 具体 的 
工作 ,职工 ,部门 .工作 岗位 组 合 可 能 有 一 个 相关 的 经 理 。 

“工作 ”联系 与 “管理 ”联系 信息 重 倒 ,每 个 “管理 ”联系 对 应 一 个 “工作 ”联系 。 然 而 ， 
一 些 “ 工 作 ” 联 系 可 能 不 对 应 任何 一 个 “管理 ”联系 。 因 此 ,我 们 不 能 丢弃 “工作 ”联系 。 通 
过 聚集 消除 元 余 , 把 联系 当 作 一 个 抽象 的 新 实体 , 允许 联系 之 间 存 在 联系 。 但 是 , 像 
图 5.7 中 的 E-R 图 ,有 些 模型 里 是 不 允许 出 现 的 ,而 采用 如 图 5. 8 所 示 的 方式 表示 聚集 。 
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职工 > 部 站 








5.7 联系 之 间 的 联系 























周一 一 <IE 作 部 门 























经 理 
5.8 聚集 方式 











5.1.2 一 个 完整 的 示例 


下 面 给 出 一 个 具体 的 例子 : 一 个 简化 的 银行 数据 库 。 其 需求 分 析 如 下 。 

某 个 银行 由 多 个 分 行 组 成 。 每 个 分 行 有 唯一 的 名 字 , 位 于 一 个 特定 的 城市 。 银 行 监 
管 所 有 分 行 的 资产 。 

银行 的 每 个 客户 都 有 一 个 唯一 的 客户 编号 ,用 社会 保险 号 表示 。 银 行 保存 了 每 个 客 
户 的 名 字 ,客户 居住 的 城市 及 街道 。 银 行 的 客户 都 有 自己 的 账户 ,可 以 向 银行 借贷 。 每 个 
客户 在 银行 里 都 有 一 个 专门 的 银行 工作 人 员 为 他 服务 ,他 有 可 能 是 负责 借贷 的 信贷 员 , 也 
有 可 能 是 个 人 理财 顾问 。 

银行 的 每 个 员工 都 有 一 个 唯一 的 员工 编号 。 银 行 保存 了 每 个 员工 的 名 字 、 电 话 号 码 、 
员工 家 属 的 名 字 以 及 员工 的 经 理 的 编号 ,还 保存 了 员工 开始 工作 的 日 期 ,从 而 掌握 员工 的 
在 职 时 间 。 

银行 提供 两 类 账户 : 储蓄 账户 和 支票 账户 。 一 个 账户 可 以 由 多 个 客户 共有 ,一 个 客 
户 也 可 以 有 多 个 账户 。 每 个 账户 都 有 一 个 唯一 的 账户 编号 。 银 行 里 记录 了 每 个 账户 的 余 
额 ,还 记录 了 这 个 账户 持 有 者 最 近 存 取 款 的 日 期 。 另 外 ,每 个 储蓄 账户 都 有 一 个 利率 ,每 





一 一 一 和 我 














扩展 的 实体 一 联系 模型 


个 支票 账户 都 有 透支 额度 。 


一 次 贷款 发 生 在 特定 的 分 行 ,该 次 贷款 可 能 由 一 个 或 多 个 客户 共同 申请 。 每 次 贷款 
都 有 一 个 唯一 的 贷款 编号 。 对 于 每 一 个 贷款 ,银行 都 保存 了 贷款 的 额度 及 每 次 还 款 日 期 。 
虽然 还 款 编号 不 能 唯一 标识 每 次 还 款 , 但 是 相对 于 一 个 具体 的 贷款 来 说 ,还 款 编号 是 唯一 
的 ,而 且 每 次 的 还 款 日 期 及 还 款额 都 被 记录 下 来 。 

其 E-R 图 如 图 5.9 所 示 。 






















































































储蓄 账户 支票 账户 


5.9 银行 数据 库 ER 图 




















该 ER 图 说 明 如 下 。 
1. 实体 及 属性 信息 


该 银行 数据 库 里 主要 记录 了 分 行 . 员 工 、 客 户 、 账 户 、 贷 款 、 还 款 实体 信息 。 

分 行 实体 的 属性 包括 分 行 城市 .分行 资产 及 分 行 名 字 ,分行 名 字 有 具有 唯一 性 。 

员工 实体 的 属性 包括 员工 编号 .员工 名 字 、 电 话 号 码 、 开 始 日 期 家属 名 字 ( 可 能 有 多 
个 家 属 )。 

客户 实体 的 属性 包括 社会 保险 号 、 客 户 名 、 客 户 城市 .客户 街 道 。 

账户 实体 的 属性 包括 账户 编号 ,余额 。 

贷款 实体 的 属性 包括 贷款 编号 、 贷 款额 。 

还 款 实体 的 属性 包含 还 款 编号 .还 款 日 期 .还 款额 。 


2. 二 元 联系 及 其 属性 


每 个 客户 都 有 一 个 员工 专门 为 他 服务 ,员工 和 客户 之 间 存 在 1 : ”的 联系 ,服务 的 类 
型 由 员工 办 理 的 业务 决定 。 
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每 个 员工 都 有 负责 管理 他 的 经 理 ,一 个 经 理 管理 多 个 员工 ,因此 在 员工 内 部 存在 1 : 
nn 的 联系 。 

一 个 客户 可 以 借 多 次 贷款 ,一 次 贷款 可 以 由 多 个 客户 共同 借贷 ,因此 他 们 之 间 存 在 
n: m 的 联系 。 

每 个 贷款 发 生 在 一 个 特定 的 分 行 ,因此 ,分 行 和 贷款 之 间 存在 1 : n 的 联系 。 

一 个 客户 可 以 有 多 个 账户 ,一 个 账户 可 以 有 多 个 客户 共同 享有 ,因此 ,客户 和 账户 之 间 
存在 n: m 的 联系 ,并 且 记 录 了 账户 持 有 者 最 近 存 取款 的 日 期 ， 日 期 ”属于 联系 上 的 属性 。 


3. 弱 实 体 

一 个 贷款 有 多 个 还 款 , 一 旦 贷款 被 还 完 , 则 还 款 也 不 再 存在 ,因此 ,还 款 是 依附 于 贷款 
的 弱 实体 。 

4. 父 类 / 子 类 


根据 账户 类 型 的 不 同 , 账 户 实体 有 储蓄 账户 和 支票 账户 两 个 子 类 ,分 别 包含 特殊 属性 
“利率 ”和 “透支 额度 ”。 


5.2 EE-R 及 EER 模型 的 设计 步 又 


E-R 模型 及 EER 模型 的 设计 虽然 是 一 个 主观 的 过 程 , 但 是 我 们 遵照 一 定 的 步骤 去 执 
行 ,可 以 使 得 概念 模型 的 设计 更 加 清晰 ,简单 。 经 过 反复 的 经 验 积累 ,总 结 出 概念 模型 设 
计 的 步骤 如 下 。 

(1) 找 出 所 有 实体 。 

(2) 找 出 每 个 实体 的 属性 。 

(3) 找 出 所 有 的 二 元 联系 及 联系 上 的 属性 。 

(4) 找 出 多 元 联系 及 联系 上 的 属性 。 

(5) 找 出 弱 实 体 。 

(6) 找 出 父 类 与 子 类 。 

(7) 找 出 聚集 。 

以 上 步骤 可 以 根据 具体 情况 改变 顺序 。 


5.3 E-R 及 EER 模型 的 设计 原则 


在 设计 E-R、EER 图 的 过 程 中 ,主要 考虑 以 下 问题 。 
(1) 是 实体 ,还 是 属性 ? 

(2) 是 实体 ,还 是 联系 ? 

(3) 是 二 元 联系 ,还 是 多 元 联系 ? 

(4) 是 否 使 用 弱 实 体 ? 

(5) 是 否 使 用 父 类 和 子 类 ? 
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(6) 是 否 使 用 聚集 ? 
下 面 以 电影 制 片 公司 数据 库 为 例 , 根 据 前 面 的 问题 ,总 结 了 ER、EER 模型 设计 的 几 


一 个 电影 制 片 公司 数据 库 记 录 了 电影 的 信息 以 及 制 片 公司 的 信息 ,保存 了 电影 名 字 
和 发 行 年 份 ,还 记录 了 制 片 公司 的 名 字 和 地 址 。 其 E-R 图 如 图 5. 10 所 示 。 


PO 


电影 = 拍摄 制 片 公 司 
































图 5.10 电影 和 制 片 公司 之 间 的 联系 表示 法 一 


要 点 1: 避免 宛 余 。 同 样 的 数据 重复 存放 ,容易 导致 不 一 致 性 。 
如 图 5. 11 所 示 ,如 果 在 制 片 公司 实体 上 出 现 了 属性 * 制 片 公司 名 字 ”, 就 不 需要 在 电 
影 实体 上 出 现 了 。 因 此 采用 图 5. 10 表示 。 











制 片 公司 




















制 片 公司 名 字 


图 5.11 电影 和 制 片 公司 之 间 的 联系 表示 法 二 


要 点 2: 当 可 以 用 属性 表达 清楚 时 ,就 不 需要 用 实体 描述 ,这 样 利 于 简化 E-R 图 , 否 


则 需要 用 实体 。 
如 图 5. 12 所 示 , 制 片 公司 名 字 和 地 址 作为 属性 不 能 表达 清楚 意思 ,因为 如 果 有 些 制 
片 公司 还 没有 拍摄 电影 ,就 导致 丢失 了 这 部 分 制 片 公司 的 信息 ,因此 , 制 片 公司 需要 单独 


电影 制 片 公司 的 地 址 


图 5.12 电影 和 制 片 公司 之 间 的 联系 表示 法 三 
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作为 实体 画 出 来 。 


它 只 


14 有 一 个 属性 “名 字 ”, 也 作为 实体 ;而 制 片 公司 包含 多 个 属性 ,因此 也 作为 实体 。 


要 点 3: 到 底 采 用 实体 ,还 是 属性 呢 ? 

实体 一 般 至 少 应 该 满足 以 下 两 点 中 的 一 点 。 

(1) 它 包含 的 属性 除了 名 字 之 外 ,应 该 还 有 其 他 的 非 码 属性 。 

(2) 它 是 多 对 多 联系 中 的 多 端 或 者 一 对 多 联系 中 的 多 端 。 

如 图 5. 13 所 示 ,电影 和 制 片 公司 分 别 作为 实体 ,电影 实体 为 1 : n 联系 的 多 端 ,尽管 


SS Ce 


电影 二 拍摄 











制 片 公司 























图 5.13 电影 和 制 片 公司 之 间 的 联系 表示 法 四 
如 图 5. 14 所 示 , 没 必要 单独 建立 一 个 制 片 公司 实体 ,因为 该 实体 只 记录 了 制 片 公司 


的 名 字 信 息 , 并 不 包含 其 他 信息 ,因此 不 采用 图 5. 15。 























电影 ”< 拍摄 > 一 | 制 片 公司 


图 5.15 电影 和 制 片 公司 之 间 的 1 : n 联系 六 














要 点 4: 同名 实体 只 能 出 现 一 次 ,还 需 去 掉 不 必要 的 联系 ,以 消除 元 余 。 
对 于 是 采用 二 元 联系 ,还 是 采用 多 元 联系 ,是 否 有 子 类 聚集 等 问题 ,需要 根据 实际 的 


应 用 环境 需求 认真 而 仔细 地 考虑 。 


一 个 系统 的 E-R 图 不 是 唯一 的 ,强调 系统 需求 的 不 同 侧面 设计 出 的 E-R 图 可 能 有 很 


大 不 同 。 
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5.4 EER 图 应 用 举例 


学 校 有 若干 系 ,每 个 系 有 若干 班级 和 教研 室 , 每 个 教研 室 有 若干 教员 ,其 中 有 的 教授 
和 副教授 各 带 若 十 研究 生 。 每 个 班级 有 若干 学 生 , 每 个 学 生 选 修 若干 课程 ,每 门 课程 可 由 
若干 学 生 选 修 。 请 画 出 该 校 的 概念 模型 。 

该 例子 已 经 在 第 4.4 节 中 给 出 ,经 过 第 5 章 的 学 习 , 请 重新 设计 该 校 的 E-R 模型 。 
由 于 研究 生 是 学 生 中 的 一 部 分 ,因此 可 以 设置 学 生 为 研究 生 的 父 类 ;类 似 地 ,教员 可 以 划 
分 为 教授 和 副教授 两 个 子 类 ,因此 该 E-R 图 可 改 为 图 5. 16 。 












































班级 “| 旦 < 组 成 > 上 | 了 系 部 “上 < 组 成 > 二 | 教研 室 
1 1 
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非 研 究 生 副教授 遇 






































图 5.16 学 校 EER 图 


5.5 小 结 


EER 模型 在 E-R 模型 的 基础 上 扩展 了 一 些 内 容 , 包 括 父 类 、 子 类 继承、 不 相交 约束 、 
完备 性 约束 、 聚 集 等 ,并 给 出 一 个 具体 的 银行 数据 库 例 子 , 然 后 给 出 了 E-R/EER 模型 的 
设计 步骤 及 设计 要 点 ,针对 第 4 章 的 例子 重新 设计 了 其 概念 模型 。 


5.6 习题 


. E-R/EER 模型 的 设计 步骤 是 什么 ? 

. E-R/EER 模型 的 设计 原则 是 什么 ? 

. 子 类 是 什么 ? 什么 是 不 相交 约束 ? 什么 是 完备 性 约束 ? 

. 一 个 公司 销售 摩托 车 ,公交 车 ,货车 ,小 轿车 ,请 用 父 类 / 子 类 ,不 相交 约束 、 完 备 性 
约束 模拟 ,自己 给 出 各 类 的 属性 。 
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第 6 章 实体 一 联系 模型 到 关系 模型 的 转换 


开发 数据 库 应 用 系统 时 ,需要 经 过 需求 分 析 抽 象 出 信息 世界 的 概念 模型 , 接 下 来 转换 
为 DBMS 支持 的 逻辑 数据 模型 (层次 模型 、 网 状 模型 .关系 模型 .面向 对 象 模型 等 ), 由 于 
现在 市 场 上 的 主流 仍然 是 关系 数据 模型 ,因此 ,本 章 的 目的 是 把 概念 模型 转化 为 关系 
模型 。 

概念 模型 的 设计 方法 有 多 种 ,包含 E-R 图 .EER 图 .UML 类 图 .ODL 等 。 而 市 场 上 
的 主流 概念 模型 仍然 是 E-R 图 /EER 图 ,因此 本 章 的 主要 任务 是 把 E-R 图 或 者 EER 图 
中 的 各 种 元 素 转换 为 关系 模型 。 

目前 ,有 许多 计算 机 辅助 软件 工程 (Computer-Aided Software Engineering,CASE) 
工具 可 以 帮助 设计 者 更 快 地 建立 概念 模型 ,可 视 化 地 转换 为 关系 模型 ,并 自动 转换 为 某 个 
特定 的 DBMS 中 的 关系 数据 库 。 此 过 程 以 本 章 的 映射 理论 为 基础 。 


6.1 E-R 模型 到 关系 模型 的 转换 


E-R 模型 到 关系 模型 的 转换 规则 就 是 把 E-R 图 中 的 元 素 转 换 为 关系 。 

E-R 模型 到 关系 的 转换 步骤 如 下 。 

(1) 常规 实体 映射 。 

(2) 弱 实 体 映 射 。 

(3) 二 元 联系 1 : 1 的 转换 。 

(4) 二 元 联系 1 : n 的 转换 。 

(5) 二 元 联系 m : n 的 转换 。 

(6) 多 值 属性 的 转换 。 

(7) n 元 联系 的 转换 。 

只 需要 完成 E-R 图 中 所 有 元 素 的 转换 即 可 。 以 上 转换 步骤 的 顺序 可 以 改变 。 


6.1.1 实体 的 映射 


E-R 图 中 的 主要 元 素 为 实体 。 实 体 又 分 为 普通 实体 ( 即 常规 实体 ) 和 弱 实体 。 

1 常规 实体 的 映射 

对 于 每 个 实体 E, 创 建 一 个 对 应 的 关系 R, 关 系 的 字段 由 中 所 有 的 简单 属性 组 
成 。 其 中 ,选择 玉 的 主 刍 作 为 关系 RR 的 主键 。 

例如 ,图 6.1 中 ,学 生 实体 包含 属性 姓名 ,年 龄 .学 号 ;学 号 为 主键。 

学 生 实体 对 应 的 关系 模式 为 : 学 生 (学 号 ,姓名 ,年 龄 )。 


实体 一 联系 模型 到 关系 模型 的 转换 

















学 生 
年 龄 
图 6.1 学 生 实体 
2. 弱 实 体 的 映射 
对 于 每 个 弱 实 体 克 及 其 所 依附 的 强 实体 下 ,创建 关系 尺 包 含 攀 的 所 有 的 简单 属性 、 
复合 属性 以 及 强 实体 EE 的 主键 。 


关系 的 主键 是 由 强 实体 的 主键 加 W 的 部 分 键 构 成 的 。 

例如 ,前 面 的 公司 数据 库 中 的 家 属 是 员工 的 弱 实 体 ,如 图 6. 2 所 示 。 根 据 转换 规则 ， 
弱 实 体 家 属 对 应 的 关系 模式 为 : 家 属 ( 员 工 编号 ,家 属 姓 名 ,性 别 , 年 龄 ), 由 员工 编号 和 家 
属 姓名 共同 组 成 主键 。 


6.2 家 属 弱 实体 












































6.1.2 二 元 联系 的 映射 


二 元 联系 分 为 1 :1.1 :nwn: m3 类 ,n:m 只 有 一 种 转换 方式 ,而 1:1 和 1:n 有 多 
种 转换 方式 。 


1. 二 元 联系 1 : 1 的 转换 


1:1 有 3 种 转换 方法 ,根据 不 同情 况 选择 合适 的 转换 方法 ,其 中 外 键 法 使 用 得 最 多 。 

1) 外 键 法 

把 其 中 一 端 实体 的 主键 直接 加 入 另外 一 端 实体 (完全 参与 ) 对 应 的 关系 中 ,同时 也 把 
联系 上 的 属性 加 入 其 中 。 主 键 为 任意 一 端 实体 的 主键 。 

例如 ,部 门 实体 与 职工 实体 之 间 的 管理 联系 1: 1, 其 中 部 门 实体 为 完全 参与 ,职工 实 
体 为 部 分 参与 ,联系 上 有 属性 “开始 日 期 ”, 如 图 6. 3 所 示 。 

根据 转换 规则 进行 转换 。 

第 一 步 ,首先 转换 2 个 实体 。 
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年 队 职工 名 J 
Car 放 职工 部 门 


才 在 起 古 


图 6.3 职工 与 部 门 的 管理 联系 





























部 门 (部 门 编号 ,部 门 名 字 ) 
职工 (职工 编号 ,职工 名 ,性 别 ,专业 ,年 龄 ) 
第 二 步 ,把 职工 实体 的 主键 “职工 编号 ”及 管理 联系 上 的 属性 “开始 日 期 * 加 入 到 部 门 





关系 中 。 


因此 ,上 面 的 图 6. 3 转换 后 的 结果 为 2 个 关系 ,其 中 实 下 画 线 为 主 码 ,虚线 标识 的 为 


外 码 : 


部 门 (部 门 编号 ,部 门 名 字 , 职 工 编号 ,开始 日 期 ) 

职工 (职工 编号 ,职工 名 ,性 别 , 专 业 , 年 龄 ) 

2) 合并 关系 法 

把 实体 和 联系 都 放 在 一 个 关系 里 , 当 两 边 实体 都 是 完全 参与 的 情况 时 ,一 般 采 用 这 种 








方法 。 


对 于 上 面 的 同一 个 例子 ,转换 后 的 结果 只 包含 一 个 关系 : 

部 门 _- 职 工 ( 职 工 编号 ,职工 名 ,性 别 ,专业 ,年龄 ,部 门 编号 ,部 门 名 字 , 开 始 日 期 ) 

上 面 的 例子 更 适合 采用 第 一 种 外 键 法 ,并 不 太 适 合 使 用 合并 关系 法 。 

3) 增加 关系 法 

建立 第 三 个 关系 尺 , 包 含 两 边 实体 的 主键 以 及 联系 上 面 的 属性 。 

针对 上 面 同一 个 例子 : 

第 一 步 , 转 换 实体 。 

部 门 (部 门 编号 ,部门 名 字 ) 

职工 (职工 编号 ,职工 名 ,性 别 , 专 业 , 年 龄 ) 

第 二 步 ,为 管理 联系 建立 单独 的 关系 , 它 由 部 门 的 主键 “部 门 编号 ”职工 的 主键 “职工 





编号 ”及 管理 联系 上 的 属性 “开始 日 期 "共同 组 成 ,因此 ,最 终 转换 后 的 结果 为 


部 门 (部 门 编号 ,部 门 名 字 ) 
职工 (职工 编号 ,职工 名 ,性 别 ,专业 ,年 龄 ) 
管理 (部 门 编号 ,职工 编号 ,开始 日 期 ), 其 中 部 门 编号 和 职工 编号 都 可 以 做 主键 。 而 





部 门 编号 和 职工 编号 又 都 是 外 键 。 
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2. 二 元 联系 1 : 的 转换 
1 : n 有 两 种 转换 规则 ,一般 采 用 外 键 法 。 





实体 一 联系 模型 到 关系 模型 的 转换 


1) 外 键 法 

把 一 端 实体 的 主键 直接 加 入 到 多 端 实体 对 应 的 关系 中 ,并 且 还 包括 联系 的 属性 。 主 
键 为 多 端 实体 的 主键 。 

例如 ,部 门 实体 与 职工 实体 之 间 的 所 属 联系 为 1 : 联系 ,如 图 6.4 所 示 。 根 据 转 换 
规则 ,转换 过 程 如 下 。 


1 n 
部 门 职工 Se 


图 6.4 职工 部 门 所 属 联系 



































第 一 步 ,转换 实体 。 

部 门 (部 门 编号 ,部 门 名 字 ) 

职工 (职工 编号 ,职工 名 字 , 性 别 ,专业 ,年 龄 ) 

第 二 步 ,转换 联系 ,把 一 端 实体 部 门 的 主键 “部 门 编号 "加 入 到 职工 关系 中 最 终 转换 后 
的 结果 为 

部 门 (部 门 编号 ,部 门 名 字 ) 

职工 (职工 编号 ,职工 名 字 ,性 别 ,专业 ,年 龄 ,部 门 编号 ) 其 中 ,多 端 实体 的 主键 “职工 
编号 "为 主键 “部 门 编号 "为 外 键 。 

2) 增加 关系 法 

建立 第 三 个 关系 尺 ,包含 两 边 实体 的 主键 以 及 联系 上 面 的 属性 ,主键 为 多 端 实体 的 主 
键 。 此 种 方法 针对 多 端 实体 中 只 有 很 少 实体 参与 联系 时 采用 ,如 果 针 对 此 种 情况 仍然 采 
用 第 一 种 转换 方法 ,会 造成 关系 中 出 现 很 多 NULL。 

上 面 的 例子 ,转换 后 的 结果 为 

部 门 (部 门 编号 ,部 门 名 字 ) 

职工 (职工 编号 ,职工 名 字 , 性 别 ,专业 ,年 龄 ) 











3. 二 元 联系 n: m 的 转换 


为 多 对 多 联系 创建 一 个 关系 尺 , 其 属性 由 两 端 实体 主键 再 加 联系 上 的 属性 构成 。 主 
键 由 两 端 实体 的 主键 组 合 而 成 。 

例如 ,学 生 与 课程 之 间 的 选修 联系 如 图 6. 5 所 示 。 

根据 转换 规则 ,转换 后 的 结果 为 

学 生 ( 学 号 ,姓名 ,年 龄 ,专业 ) 

课程 (课程 编号 ,课程 名 字 ) 
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图 6.5 学 生 与 课程 之 间 的 选修 联系 


选修 (学 号 ,课程 编号 ,成 绩 ) ,其 中 学 号 和 课程 编号 都 为 选修 关系 的 外 键 。 
6.1.3 其 他 元 素 的 映射 


1. 三 元 及 多 元 联系 的 转换 


对 于 每 个 三 元 或 者 多 元 联系 ,创建 一 个 关系 及 ,包含 参与 该 联系 的 所 有 实体 的 主键 
以 及 联系 上 的 属性 ,主键 由 所 有 实体 的 主键 组 合 而 成 。 根 据 转换 规则 ,对 图 6. 6 进行 


















































转换 。 
Evi CD CD i CD 《全 目 和 称 ) 代目 地 上 
供应 商 供应 项 目 
零件 
《TD i i 
图 6.6 供应 联系 
第 一 步 , 转 换 实体 。 


供应 商 (供应 商 编 号 ,供应 商 姓名 ,电话 号 码 ) 

项 目 (项 目 编号 ,项 目 名 称 ,项 目地 址 ) 

零件 (零件 编号 ,零件 名 称 ,类 型 ) 

第 二 步 , 转 换 联系 。 

因此 ,图 6.6 转换 后 的 结果 为 4 个 关系 。 

供应 商 (供应 商 编 号 ,供应 商 姓名 ,电话 号 码 ) 

项 目 ( 项 目 编号 ,项 目 名 称 ,项 目地 址 ) 

零件 (零件 编号 ,零件 名 称 ,类 型 ) 

供应 (供应 商 编 号 ,项 目 编号 ,零件 编号 ,数量 ) ,主键 由 3 个 实体 的 主键 组 合 而 成 。 
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实体 一 联系 模型 到 关系 模型 的 转换 


2. 多 值 属性 的 转换 


对 于 多 值 属性 A, 单 独 为 它 创 建 一 个 新 关系 RR, 它 包含 主 实体 的 主键 ,以 及 多 值 属性 
本 身 。 主 键 由 主 实体 的 主键 及 多 值 属性 两 者 共同 组 成 。 
例如 ,部 门 实体 (图 6.7) 的 “地 址 ”属性 为 多 值 属性 ,因此 需要 单独 转换 。 


图 6.7 地 址 多 值 属 性 




















转换 后 的 结果 为 
部 门 地 址 (部 门 编号 ,地 址 ) ,主键 由 部 门 编号 及 地 址 两 者 组 合 而 成 。 


6.2 一 个 完整 的 E-R 模型 转换 示例 
根据 前 面 介绍 的 规则 ,转换 第 4 章 中 公司 数据 库 的 E-R 图 ,结果 如 图 6.8 所 示 。 


a 


社会 保险 号 职工 名 字 | 性 别 | 出 生日 期 工资 地 址 | 部 门 编号 | 项 头 上 司 社会 保险 号 


ss 
部 门 编号 | 部 门 名 称 | 部 门 经 理 的 社会 保险 号 | 开始 时 间 

















































































项 目 编号 | 项 目 名 称 | 项 目地 址 | 部 门 编号 


























职工 社会 保险 号 | 项 目 编号 | 小 时 数 














职工 社会 保险 号 | 家 属 名 字 | ”性 别 | 出 生日 期 | 关系 
图 6.8 公司 数据 库 关系 模式 

















说 明 如 下 。 

步骤 1, 常规 实体 的 转换 。 在 ER 图 中 有 3 个 常规 实体 : 职工 、 部 门 、 项 目 ,转换 
如 下 。 

职工 (社会 保险 号 ,职工 名 字 ,性 别 , 出 生日 期 ,工资 ,地 址 ) 

部 门 (部 门 编号 ,部 门 名 称 ) 

项 目 ( 项 目 编号 ,项 目 名 称 ,项 目地 址 ) 
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步骤 2, 弱 实体 的 转换 。E-R 图 中 的 家 属 是 弱 实体 ,转换 如 下 。 

家 属 (职工 社会 保险 号 ,家属 名 字 ,性 别 ,出 生日 期 ,关系 ) 

步骤 3,1 : 1 联系 的 转换 。E-R 图 中 只 存在 一 个 1 : 1 联系 , 它 是 部 门 和 职工 之 间 的 
管理 联系 。 根 据 转换 规则 适合 采用 外 键 法 ,把 职工 实体 的 主键 “职工 编号 ”加 入 到 “部 门 ” 
实体 对 应 的 关系 中 (因为 部 门 实体 为 完全 参与 ), 同 时 还 加 入 联系 上 的 属性 “开始 时 间 ”。 
因此 ,修改 步骤 一 的 部 门 关系 为 

部 门 (部 门 编号 ,部 门 名 字 , 部 门 经 理 的 社会 保险 号 ,开始 时 间 ) 

管理 的 联系 实际 表示 的 就 是 每 个 部 门 都 有 一 个 管理 人 。 

步骤 4,1 : n 联系 的 转换 ,在 E-R 图 中 有 4 个 1:n 联系 。 

(1) 部 门 和 项 目 之 间 的 1 : n 的 管理 联系 ,采用 外 键 法 把 一 端 部 门 实体 的 主键 “部 门 
编号 ”加 入 到 多 端 实 体 对 应 的 关系 “项 目 ” 中 ,因此 ,步骤 1 中 的 项 目 关 系 修改 为 








门 管理 。 

(2) 职工 与 部 门 之 间 的 “工作 ”联系 ,采用 外 键 法 把 一 端 实体 部 门 的 主键 “部 门 编号 ” 
加 入 到 多 端 实体 对 应 的 关系 “职工 ”中 ,因此 步骤 一 中 的 职工 关系 修改 为 

职工 (社会 保险 号 ,职工 名 字 , 性 别 ,出 生日 期 ,工资 ,地 址 ,部 门 编号 ) ,实际 上 表示 的 
是 每 个 职工 属于 哪个 部 门 。 

(3) 职工 实体 内 部 存在 1 : n 的 顶头 上 司 ( 直 接管 理 者 ) 的 联系 ,采用 外 键 法 把 一 端 实 
体 的 主键 加 入 到 多 端 对 应 的 关系 中 ,由 于 这 里 的 一 端 实体 和 多 端 实体 都 为 职工 本 身 , 只 需 
要 把 职工 的 顶头 上 司 的 社会 保险 号 加 入 到 职工 关系 中 ,因此 ,上 一 步 的 职工 关系 再 次 被 修 
改 为 

职工 (社会 保险 号 ,职工 名 字 ,性 别 , 出 生日 期 ,工资 ,地 址 ,部 门 编号 ,顶头 上 司 社 会 保 
丛 昂 ) 

(4) 职工 与 家 属实 体 之 间 存在 1 : n 的 联系 ,采用 外 键 法 把 职工 实体 的 主键 加 入 到 家 
属 对 应 的 关系 中 ,发 现 其 转换 后 的 结果 和 前 面 的 弱 实 体 一 致 。 因 此 , 弱 实 体 与 强 实体 之 间 
的 联系 不 需要 转换 。 

步骤 5,n: m 联系 的 转换 ,在 该 E-R 图 中 存在 一 个 n: m 的 联系 , 它 是 职工 与 项 目 之 
间 的 “参与 ?联系 。 只 有 一 种 转换 方法 ,单独 建立 一 个 关系 ,包含 项 目 和 职工 实体 的 主键 以 
及 “参与 "联系 上 的 属性 “小 时 数 ”, 因 此 转换 后 为 

参与 (职工 社会 保险 号 ,项 目 编号 ,小 时 数 ) 

步骤 6, 多 值 属性 的 转换 ,在 E-R 图 中 的 部 门 实体 上 ,存在 一 个 地 址 的 多 值 属性 ,单独 
为 它 转换 为 关系 : 

部 门 地 址 (部 门 编号 ,地 址 ) 

因此 ,经 过 6 个 步骤 ,该 E-R 图 的 最 终 转换 结果 为 6 个 关系 : 

项 目 ( 项 目 编号 ,项 目 名 字 , 部 门 编号 ) 











职工 (社会 保险 号 ,职工 名 字 , 性 别 ,出 生日 期 ,工资 ,地 址 ,部 门 篇 号 ,顶头 上 司 社会 保 
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家 属 (职工 社会 保险 号 ,家 属 名 字 , 性 别 , 出 生日 期 ,关系 ) 

参与 (职工 社会 保险 号 ,项 目 编号 ,小 时 数 ) 

部 门 地 址 (部 门 编号 ,地 址 ) 

如 图 6. 8 所 示 , 下 夯 线 实 线 表示 主键 ,箭头 表示 外 键 ,指向 被 参考 关系 的 被 参考 属性 ， 
虚 下 画 线 为 外 键 ,并 且 关系 部 门 地 址 中 的 部 门 编号 也 为 外 键 , 参 与 关系 中 的 职工 编号 和 项 
目 编号 分 别 为 外 键 ,家 属 中 的 职工 社会 保险 号 为 外 键 。 


6.3 ”EER 模型 到 关系 模型 的 转换 


本 节 将 介绍 EER 模型 中 增加 的 元 素 到 关系 模型 的 转换 规则 。EER 模型 的 转换 仅 包 
含 两 个 步骤 。 

步骤 1: 父 类 与 子 类 的 转换 。 

步骤 2: 聚集 的 转换 。 











6.3.1 父 类 与 子 类 的 转换 


假设 父 类 C{k,a ,as，,…,a,},k 是 主键 ,a ,as，…,a, 为 属性 ;Si ,Ss,…,S, 为 m 个 子 
类 。 父 类 与 子 类 的 转换 有 多 种 选择 ,下 面 介绍 4 种 转换 方法 。 

第 一 种 转换 方法 : 父 类 子 类 法 ,适用 于 所 有 的 继承 情况 。 

为 父 类 C 创建 一 个 关系 尺 ,为 RCk,al,as，…,a,), 关 系 R 的 主键 为 &。 为 每 个 子 类 
S; 创建 一 个 对 应 的 关系 R;,R; 三 {&)U 1{S; 特有 的 属性 } ,关系 R; 的 主键 也 为 A。 

例如 ,如 图 6.9 所 示 , 员 工 为 父 类 实体 ,秘书 ,技术 员 工程师 为 子 类 实体 。 























打字 速度 技术 级 别 工程 师 类 型 
秘书 技术 员 工程 师 





























6.9 员工 实体 及 其 子 类 


转换 后 的 结果 为 
员工 (社保 号 ,姓名 ,出 生日 期 ,地 址 ,工作 类 型 ) 
秘书 (社保 号 ,打字 速度 ) 
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技术 员 ( 社 保 号 ,技术 级 别 ) 

工程 师 ( 社 保 号 ,工程 师 类 型 ) 

第 二 种 转换 方法 : 仅 子 类 法 。 

为 每 个 子 类 Si; 创建 一 个 对 应 的 关系 Ri;,R; 二 {ksals,as，…,as) U1{S; 特有 的 属性 } , 主 
键 为 ,这 种 映射 方法 只 适合 于 完全 子 类 化 ( 即 每 个 父 类 必须 至 少 属于 一 个 子 类 )。 

例如 , 父 类 实体 车 辆 , 子 类 实体 轿车 和 卡车 ,如 图 6. 10 所 示 。 



































6.10 车 辆 及 其 子 类 图 


转换 后 的 结果 为 

轿车 (机 动车 编号 ,许可 证 号 ,价格 ,最 快速 度 , 乘 客 数量 ) 

卡车 (机 动车 编号 ,许可 证 号 ,价格 ,车 轴 数 量 ,吨位 ) 

第 三 种 转换 方法 : 带 有 单一 类 型 属性 的 单一 关系 法 。 

即 只 创建 一 个 关系 尽 , 包 含 父 类 的 所 有 属性 以 及 所 有 子 类 的 所 有 属性 再 加 上 一 个 类 
别 属性 尽 一 {A,ai ,az ,van)U{S 特有 的 属性 }U…U1S。 特有 的 属性 } U 2) ,其 中 1 为 
类 别 属性 ,主键 为 A。 注 意 : 这 种 方法 只 适用 于 子 类 互 不 相交 的 类 型 ,还 可 能 会 产生 很 多 
空 值 。 

例如 , 父 类 实体 员工 , 子 类 实体 秘书 技术员、 工程 师 。 转 化 后 的 结果 为 

员工 (社保 号 ,姓名 ,出 生日 期 ,地 址 ,工作 类 型 ,打字 速度 ,技术 级 别 , 工 程 师 类 型 ) ,其 
中 工作 类 型 为 类 别 属 性 ,用 于 判断 该 员工 实体 属于 哪个 子 类 。 

第 四 种 转换 方法 : 带 有 多 类 型 属性 的 单一 关系 法 。 

创建 一 个 关系 尺 ,包含 所 有 父 类 的 属性 和 子 类 的 属性 ,并 且 加 上 每 个 子 类 的 类 别 属 
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性 。 尺 一 (A,ai ,az ,as U1Si 特有 的 属性 }U…U1{S。 特有 的 属性 }U {a ,tz，,… ,ta) ,其 
中 为 布尔 值 的 类 别 属性 ,表示 是 否 属于 子 类 Si ,主键 为 &。 这 种 转换 方法 适用 于 子 类 相 
又 加 类 型 。 

例如 , 父 类 实体 零件 , 子 类 实体 制造 零件 、 购 买 零 件 ,如 图 6. 11 所 示 。 


零件 编号 描述 
零件 


人 作 应 商 名 字 


制造 零件 购买 零件 


制造 日 供应 价格 


图 6.11 零件 及 子 类 实体 


























转换 后 的 结果 为 
零件 (零件 编号 ,描述 ,是 否 币 造 类 实体 类 型 ,制造 日 期 ,批号 ,是 否 购买 符 件 类 型 , 供 
应 商 名 字 ,供应 价格 ) 


6.3.2 聚集 的 转换 


聚集 的 转换 规则 如 下 。 

(1) 参与 聚集 的 每 个 实体 单独 转换 。 

(2) 聚集 体内 的 联系 的 转换 。 

(3) 聚集 联系 的 转换 。 

如 图 6.12 所 示 , 由 岗位 ,部门 .职工 ,经理 4 个 实体 构成 聚集 ,其 中 实体 岗位 部门. 职 
工 构成 聚集 体 ,聚集 联系 为 “管理 ”, 根 据 转换 规则 进行 如 下 转换 。 








岗位 






































经 理 
图 6.12 育 集 联系 
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(1) 转换 聚集 中 的 4 个 实体 : 岗位 部门、 职工 、 经 理 。 
(2) 转换 聚集 体内 的 “工作 ”联系 。 
(3) 转换 聚集 联系 “管理 ”联系 ,把 3 个 实体 构成 的 聚集 体 看 成 一 个 实体 ,该 实体 的 属 


性 由 参与 这 个 聚集 体 的 所 有 实体 的 主键 构成 。 


若 有 岗位 实体 的 属性 为 岗位 编号 、 岗 位 名 称 、 岗 位 待遇 ;部 门 实体 的 属性 有 部 门 编号 、 


部 门 名 字 部门 地 址 ;职工 实体 的 属性 有 职工 编号 、 职 工 名 字 、 性 别 \ 年 龄 ;经 理 也 是 职工 ， 
它 有 特殊 属性 “开始 日 期 "表示 管理 此 部 门 的 开始 时 间 。 图 6. 12 转换 后 的 结果 如 下 。 


6.4 
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(1) 岗位 (岗位 编号 ,岗位 名 称 ,岗位 待遇 ) 。 

(2) 部 门 (部 门 编号 ,部 门 名 字 ,部 门 地址) 。 

(3) 职工 (职工 编号 ,职工 名 字 ,性 别 ,年龄 ) 。 

(4) 经 理 (经 理 职工 编号 ,开始 日 期 ) 。 

(5) 工作 (职工 编号 ,部门 编号 ,岗位 编号 ) 。 

(6) 管理 (职工 编号 ,部门 编号 ,岗位 编号 ,经 理 职工 编号 ) 。 


一 个 完整 的 EER 模型 转换 示例 




















根据 本 章 介绍 的 步骤 把 第 5 章 给 出 的 银行 数据 库 转换 为 关系 模型 ,如 图 6. 13 所 示 。 







































































图 6.13 银行 数据 库 EER 


步骤 如 下 。 

(1) 转换 实体 。 在 EER 图 中 存在 分 行 、 客 户 、 贷 款 、 员 工 4 个 实体 ,转换 为 如 下 : 
分 行 (分 行 名 字 ,分 行 城市 ,分 行 资产 ) 

客户 (客户 编号 /社会 保险 号 ,客户 名 ,客户 街道 ,客户 城市 ) 
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贷款 (贷款 编号 ,贷款 额 ) 

员工 (员工 编号 ,员工 名 字 , 电 话 号 码 , 开 始 日 期 ) 

(2) 转换 弱 实体 。 在 EER 图 中 存在 一 个 弱 实 体 还 款 , 它 依附 于 强 实体 贷款 ,转换 结 
果 如 下 : 

还 款 (贷款 编号 ,还 款 编号 ,还 款 日 期 ,还 款额 ) 

(3) 转换 1 : 1 联系 。 在 EER 图 中 不 存在 该 类 型 的 联系 。 

(4) 转换 1 : n 联系 。 在 EER 图 中 有 4 个 1:n 联系 。 它 们 是 员工 和 客户 之 间 的 1: 
nn 联系 ;分 行 和 贷款 之 间 的 1:n 联系 ;员工 内 部 的 1:n 联系 ;贷款 和 还 款 之 间 的 1:n 联 
系 。 贷 款 和 还 款 之 间 的 联系 可 以 不 用 转换 ;对 1 : n 的 员工 客户 联系 采用 增加 “客户 服务 ” 
关系 的 方法 ;另外 两 个 联系 采用 外 键 法 ,修改 多 端 实体 对 应 的 关系 。 因 此 ,修改 贷款 、 员 工 
两 个 关系 ,结果 为 

客户 服务 (客户 编号 ,员工 编号 ,业务 类 型 ) 

贷款 (贷款 编号 ,贷款 额 ,分 行 名 空 ) 

员工 (员工 编号 ,员工 名 字 , 电 话 号 码 , 雇 佣 期 限 ,经 理 编 号 ) 

(5) 转换 nn: m 联系 。 在 E-R 图 中 存在 两 个 此 类 联系 。 它 们 是 客户 和 贷款 之 间 的 借 
贷 联系 ;客户 和 账户 之 间 的 存 取 款 联系 ,分 别 对 该 类 联系 增加 一 个 新 的 关系 : 

借贷 (客户 编号 ,贷款 编号 ) 

存 取款 (客户 编号 ,账户 编号 ,日 期 ) 

(6) 转换 多 值 属 性 。 员 工 实 体 上 的 家 属 单独 转换 为 

家 属 ( 员 工 编号 ,家 属 名 字 ) 

(7) 转换 多 元 联系 。 在 该 EER 图 中 不 存在 此 类 联系 。 

(8) 转换 父 类 与 子 类 。 在 此 EER 图 中 ,储蓄 账户 和 支票 账户 是 账户 的 子 类 ,由 于 父 
类 账户 中 的 每 个 实体 完全 子 类 化 ,因此 采用 仅 子 类 法 转换 为 

储蓄 账户 (账户 编号 ,余额 ,利率 ) 

支票 账户 (账户 编号 ,余额 ,透支 额度 ) 

(9) 转换 聚集 。 该 EER 图 中 不 存在 此 类 联系 。 

因此 ,该 EER 图 的 最 终 转 换 结果 为 

分 行 (分 行 名字 ,分 行 城市 ,分 行 资产 ) 

客户 (客户 编号 ,客户 名 ,客户 街道 ,客户 城市 ) 

还 款 ( 贷 款 编号 ,还 款 编号 ,还 款 日 期 ,还 款额 ) 

贷款 (贷款 编号 ,贷款 额 ,分 行 和 名字 ) 

员工 (员工 编号 ,员工 名 字 , 电 话 号 码 , 雇 佣 期 限 ,经 理 编 号 ) 

















借贷 (客户 编号 ,贷款 编号 ) 

存 取 款 (客户 编号 ,账户 编号 ,日 期 ) 
家 属 (员工 编号 ,家 属 名 字 ) 

储蓄 账户 (账户 编号 ,余额 ,利率 ) 
支票 账户 (账户 编号 ,余额 ,透支 额度 ) 
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6.5 小 结 


本 章 详细 讨论 了 E-R 模型 到 关系 模型 的 转换 规则 ,以 及 EER 模型 到 关系 模型 的 转 
换 规则 。 本 章 通 过 公司 数据 库 的 例子 讲述 E-R 模型 到 关系 模型 的 转换 规则 ;通过 银行 数 
据 库 的 例子 讲述 EER 模型 到 关系 模型 的 转换 规则 。 


6.6 习题 


1. E-R/EER 模型 到 关系 模型 的 转换 步骤 是 什么 ? 

2. 第 4 章 第 4 题 的 E-R 图 转换 为 关系 模型 ,可 以 转换 为 多 少 个 关系 ? 请 选择 一 种 
列 出 。 

3. 把 第 4 章 第 5 题 中 的 E-R 图 转换 为 关系 模型 。 

4. 把 图 6. 14 转换 为 关系 模型 。 





时 长 名 字 年 份 类 型 





























动画 片 枪杀 片 








6.14 电影 关系 数据 库 EER 图 


5. 把 第 5 章 第 4 题 转换 为 关系 模型 。 
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“第 7 章 UML 类 图 建 模 


统一 建 模 语言 (Unified Modeling Language, UML) 是 面向 对 象 软件 的 标准 化 建 模 语 
言 , 它 是 一 个 支持 模型 化 和 软件 系统 开发 的 图 形 化 语言 ,为 软件 开发 的 所 有 阶段 提供 模型 
化 和 可 视 化 支持 ,是 可 视 化 建 模 语言 的 工业 标准 。 

UML 的 目标 是 以 面向 对 象 图 的 方式 来 描述 任何 类 型 的 系统 ,具有 广泛 的 应 用 领域 ， 
成 功 应 用 于 电信 金融、 航天 航空 .制造 与 工业 自动 化 .医疗 ,交通 .电子 商务 等 领域 。 在 这 
些 领域 中 ,UML 的 建 模 包括 大 型 .复杂 、 实 时 、 分 布 式 、 集 中 式 数据 或 者 计算 ,以 及 嵌入 式 
系统 等 ,而 且 还 用 于 软件 再 生 工程 .质量 管理 ,过程 管理 ,配置 管理 等 方面 。 


7.1 概述 


UML 中 包含 类 图 ,用例 图 ,状态 图 、 活 动 图 等 9 种 图 。UML 可 为 软件 开发 的 所 有 阶 
段 建 模 , 既 可 以 为 系统 的 动态 行为 建 模 , 也 可 以 为 系统 的 静态 行为 建 模 。 本 章 主 要 介绍 
UML 类 图 建 模 。UML 类 图 建 模 是 对 系统 静态 结构 的 建 模 , 它 和 E-R 图 及 EER 图 类 似 ， 
主要 用 在 数据 库 设 计 的 概念 建 模 阶段 。 

UML 类 图 在 系统 的 整个 生命 周期 中 都 是 有 效 的 ,是 面向 对 象 系统 建 模 中 最 常见 的 
图 ,也 是 用 来 描述 数据 对 象 及 对 象 之 间 的 联系 的 图 ,同时 还 是 帮助 概念 建 模 的 一 种 有 效 
方法 。 





7.2 UML 类 图 表示 法 


UML 类 图 具备 和 E-R 模型 一 样 的 表达 能 力 。 在 UML 类 图 中 ,用 类 代替 实体 ,并 且 
在 类 中 还 添加 了 方法 。 下 面 依次 介绍 UML 类 图 中 的 元 素 。 


1. 类 


类 (Class) 与 ER 图 中 的 实体 对 应 。 通 常用 一 个 矩形 框 表 
示 类 ,矩形 框 分 为 三 部 分 : 顶部 放置 类 名 ,中间 部 分 放置 类 属 
性 ,属性 冒号 后 跟随 属性 的 取 值 范围 ;底部 放置 类 的 方法 。 例 
如 ,ER 图 中 的 学 生 实体 在 UML 类 中 的 表示 如 图 7. 1 所 示 。 | 姓名 : Stine 
在 学 生 类 中 有 属性 学 号 、 姓 名 、 年 龄 取 值 为 整 型 .性 别 取 值 为 | 生冷 : 证 
“ 男 ? 或 者 * 女 ”, 还 包含 一 个 方法 “选课 ”, 该 学 生 类 的 学 号 后 面 | 性别; 偶 , 女 
还 标注 了 PK, 表 示 学 号 为 学 生 类 的 主键 。 在 以 后 的 类 图 中 省 
略 方法 ,只 保留 类 名 和 属性 。 商 交 天 证 


学 吕 : PK 
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2. 关联 


关联 (association) 类 似 于 E-R 模型 中 的 联系 ,是 指 类 之 间 的 二 元 联系 。 在 UML 中 
没有 多 元 联系 的 模拟 ,因此 多 元 联系 必须 首先 转换 为 二 元 联系 。 类 之 间 的 关联 用 一 根 直 
线 连 接 , 并 给 出 关联 的 名 字 。 关 联 的 类 型 用 最 小 最 大 (min,max) 表 示 法 。 

如 图 7. 2 所 示 ,班级 和 班长 之 间 的 关联 关系 类 似 于 1 : 1 的 二 元 联系 。 班 长 端的 1..1 
表示 一 个 班级 最 少 由 一 个 班长 管理 ,最 多 也 有 一 个 班长 管理 ;班级 端的 1.. 1 表示 一 个 班 
长 最 少 管理 一 个 班级 ,最 多 也 管理 一 个 班级 。 


班级 
编号 : PK 
人 数 : int 





班级 
编号 : PK 
人 数 : int 


课程 
课程 编号 : PK 
课程 名 字 : 

















图 7.2 几 种 关联 类 型 


班级 和 学 生 之 间 的 关联 关系 类 似 于 1 : n 联系 。 学 生 端的 1.. 40 表示 一 个 班级 最 少 
有 一 个 学 生 , 最 多 有 40 个 学 生 ; 班 级 端的 1.. 1 表示 一 个 学 生 最 少 属于 一 个 班级 ,最 多 也 
只 属于 一 个 班级 。 

课程 和 学 生 之 间 的 关联 关系 类 似 于 n: m 联系 。 课 程 端的 0.. * 表示 一 个 学 生 可 以 
不 选课 ,也 可 以 选修 多 门 课程 , * 表示 选修 的 课程 数量 无 上 限 ;学 生 端的 0.. * 表示 一 门 
课程 可 以 没有 学 生 选 ,也 可 以 由 多 个 学 生 选 。 

自 关联 即 自己 和 自己 之 间 的 关联 ,是 发 生 在 同一 类 内 部 对 象 之 间 的 关联 。 如 图 7. 3 
所 示 , 学 生 和 班长 之 间 的 关联 就 属于 自 关联 。 班 长 也 属于 学 生 类 中 的 对 象 。 在 自 关联 中 ， 
两 端 分 别 用 文字 表示 类 在 关联 关系 中 担任 的 角色 。 学 生 端 为 管理 的 角色 , 另 一 端 为 被 管 
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理 的 角色 。 
学 生 
学 号 : PK 1.1 管 理 
姓名 : 1..40 被 管理 
年 龄 : 
图 7.3 学 生 类 自 关联 
3. 父 类 / 子 类 


在 UML 中 , 子 类 的 表示 方法 和 父 类 一 样 ,也 是 用 矩形 框 表示 ,它们 之 间 的 关系 用 一 
个 三 角形 表示 。 学 生 类 、 研 究 生 类 本科 生 类 之 间 的 关系 如 图 7.4 所 示 , 研 究 生 类 和 本 科 
生 类 是 学 生 类 的 子 类 ,研究 生 具 有 特殊 的 属性 “研究 生 学 历 ”, 本 科 生 具有 特殊 的 属性 “本 
科 生 学 历 ”, 三 角形 是 实心 的 表示 子 类 之 间 可 以 相交 ,否则 表示 子 类 之 间 不 可 以 相交 。 一 
个 学 生 不 可 能 既是 研究 生 又 是 本 科 生 ,因此 不 是 实心 。 









7.4 ”学生 类 及 其 子 类 


在 UML 类 图 中 没有 对 弱 实 体 、 多 值 属性 的 专门 模拟 方式 ,但 在 关联 关系 的 类 型 里 增 
加 了 聚集 和 组 合 , 用 来 表示 整体 和 部 分 的 关系 。 


4. UML 类 图 中 的 聚集 


UML 类 图 中 的 聚集 用 来 描述 两 个 类 之 间 是 整体 和 部 分 的 关系 ,其 中 一 个 类 为 整体 ， 
它 由 一 个 或 者 多 个 部 分 类 组 成 。 在 聚集 中 ,部 分 类 可 以 独立 存在 。UML 中 的 聚集 表示 
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法 如 图 7. 5 所 示 , 用 一 根 带 一 个 菱形 框 的 线 连 接 整 体 类 和 部 分 类 ,菱形 框 指向 整体 类 。 
例如 ,如 图 7.6 所 示 , 中 央 处 理 器 和 显示 器 都 可 以 独立 存在 ,但 又 可 以 组 成 计算 机 。 


计算 机 











中 央 处 理 器 显示 器 





图 7.5 UML 中 的 聚集 表示 法 图 7.6 聚集 示例 一 


进一步 扩展 为 图 7.7。 





键盘 

















计算 机 鼠标 


扬声器 
显示 器 

















中 央 处 理 器 





运算 器 控制 器 

















图 7.7 聚集 示例 二 


5. UML 类 图 中 的 组 合 


UML 类 图 中 的 组 合用 来 描述 两 个 类 之 间 是 整体 和 部 分 的 关系 ,其 中 一 个 类 为 整体 ， 
由 一 个 或 者 多 个 部 分 类 组 成 。 在 组 合 中 ,部 分 类 不 可 以 独立 存在 。 整体 类 和 部 分 类 用 实 
心 莪 形 框 连接 ,如 图 7. 8 所 示 。 

例如 ,数据 库 组 成 用 UML 图 表示 为 图 7. 9, 整 体 类 数据 库 由 部 分 类 表 和 查询 构成 ， 
一 旦 没有 数据 库 , 表 和 查询 也 不 会 存在 。 














UML 类 图 建 模 











部 分 类 





图 7.8 UML 中 的 组 合 表示 法 7.9 组合 示例 


7.3 示例 


采用 UML 类 图 表示 第 4 章 的 公司 数据 库 ,如 图 7. 10 所 示 。 










































































联系 类 型 
Wie 
~_® On 
—O 
UML 中 的 聚集 表示 法 
出 生日 期 : 日 期 整体 代 > 一 | 部 分 




















与 职工 的 关系 : 








图 7.10 公司 数据 库 UML 类 图 


对 该 UML 类 图 ,说 明 如 下 几 点 。 

(1) 针对 公司 数据 库 ,模拟 出 了 职工 项 目 、 部 门 、 家 属 4 个 类 。 

(2) 把 类 之 间 的 相互 联系 模拟 成 UML 的 关联 关系 ,并 用 最 小 最 大 法 进行 描述 。 

(3) 对 于 弱 实体 的 模拟 ,由 于 UML 类 图 中 没有 专门 的 模拟 符号 ,所 以 采用 聚集 方式 
进行 模拟 ,表示 “有 ”的 关联 关系 。 在 该 UML 类 图 中 ,家 属 类 与 职工 类 之 间 模 拟 成 部 分 与 
整体 的 关系 ,表示 职工 有 家 属 , 并 用 标志 性 属性 “家 属 名 字 ” 放 在 矩形 框 里 附加 在 职工 类 


上 ,以 区 分 不 同 的 家 属 。 
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(4) 对 于 多 值 属性 的 模拟 ,由 于 UML 类 图 中 没有 专门 的 模拟 符号 ,所 以 采用 聚集 方 
式 进行 模拟 ,表示 “地 址 ”既是 部 门类 的 组 成 部 分 ,又 是 项 目 类 的 组 成 部 分 。 

(5) UML 类 图 中 的 关联 类 型 与 E-R 图 中 的 最 小 最 大 表示 法 相反 。( 比 较 图 4. 26) 

(6) x* 表示 0.. * ,1 表示 1..1。 


7.4 UML 类 图 到 关系 模型 的 转换 


UML 类 图 到 关系 模型 的 转换 规则 包含 以 下 3 点 。 
1. 类 到 关系 的 转换 


类 到 关系 的 转换 方法 和 实体 到 关系 的 转换 方法 一 致 。 为 该 类 创建 一 个 关系 ,关系 的 
字段 由 类 的 属性 组 成 。 


2. 关联 到 关系 的 转换 
为 每 个 关联 创建 一 个 关系 ,关系 的 属性 由 参与 关联 的 类 的 主键 构成 ,此 外 ,再 加 上 关 











联 上 的 属性 。 
如 图 7.11 所 示 ,一 个 电影 制 片 公司 数据 库 里 包含 制 片 公司 .明星 .电影 3 个 类 。 
拍摄 0. 
电影 
名 字 : PK 
拍摄 年 份 : PK 
时 长 : 
0 ee: 
一 
出 演 





图 7.11 电影 制 片 公 司 数据 库 UML 类 图 


将 该 UML 类 图 转换 为 关系 模型 如 下 所 示 ,3 个 类 对 应 3 个 关系 如 下 : 
电影 (电影 名 字 ,拍摄 年 份 ,时 长 ,类 型 ) 

明星 (明星 名 字 , 地 址 ) 

制 片 公司 ( 制 片 公司 名 字 .地址 ) 

两 个 关联 对 应 的 两 个 关系 如 下 : 
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出 演 ( 电 影 名 字 ,拍摄 年 份 ,明星 名 字 ) 

拍摄 ( 制 片 公司 名 字 , 电 影 名 字 ,拍摄 年 份 ) 

如 图 7. 12 所 示 ,学 生 与 课程 之 间 的 选修 关联 转换 为 如 下 关系 : 
学 生 (学 号 ,姓名 ,年 龄 ) 

课程 (课程 编号 ,课程 名 字 , 学 分 ) 

选修 (学 号 ,课程 编号 ,成 绩 ) 














课程 编号 : PK 


课程 名 字 : 
学 分 : 





图 7.12 学 生 选 修 课程 UML 类 图 


3. 父 类 / 子 类 到 关系 的 转换 


父 类 / 子 类 到 关系 的 转换 可 以 参考 E-R 模型 中 的 父 类 / 子 类 转换 方式 ,有 多 种 转换 方 
法 ,这 里 推荐 以 下 3 种 方法 。 

第 一 种 ,为 每 个 类 建立 一 个 关系 , 父 类 关系 包含 主键 及 其 属性 , 子 类 关系 包含 主键 及 
子 类 特有 的 属性 。 

第 二 种 ,为 所 有 类 只 建立 一 个 关系 ,包含 主键 及 所 有 类 的 属性 。 

第 三 种 ,为 每 个 子 类 各 建立 一 个 关系 ,包含 所 有 的 公共 属性 及 特有 的 属性 。 

员工 及 其 子 类 的 UML 类 图 如 图 7. 13 所 示 。 

有 可 能 在 员工 中 还 存在 其 他 岗位 类 型 的 职工 没有 列 出 来 , 且 所 有 属性 放 在 一 个 关系 
里 ,容易 造成 很 多 空 值 ,因此 采用 第 一 种 方法 ,转换 后 的 结果 如 下 : 

员工 (社保 号 ,姓名 ,出 生日 期 ,地 址 ) 

秘书 (社保 号 ,打字 速度 ) 

技术 员 ( 社 保 号 ,技术 级 别 ) 

工程 师 ( 社 保 号 ,工程师 类 型 

实际 上 ,UML 类 图 到 关系 模型 的 转换 方法 和 E-R 图 到 关系 模型 的 转换 方法 非常 
类 似 , 因 此 可 以 参考 ER 图 的 转换 方式 ,对 具体 的 情况 进行 分 析 , 采 用 合适 的 转换 
方法 。 


7.5 数据 库 设 计 工 具 


进行 数据 库 设计 时 ,很 多 数据 库 专家 都 依靠 自己 的 专业 知识 和 经 验 进行 人 工 设计 ,但 
是 在 有 些 情况 下 必须 采用 辅助 工具 设计 ,例如 : 
(1) 应 用 环境 里 经 常 包含 很 多 复杂 的 数据 ,复杂 的 联系 以 及 约束 ,而 对 于 同样 的 信 
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社保 :PK 
出 生日 期 

















秘书 | 找 术 员 
别 


| I | 
打字 速度 技术 工程 i 类型 


图 7.13 员工 及 其 子 类 的 UML 类 图 





息 , 设 计 选项 和 方案 有 很 多 ,这 时 可 以 考虑 用 数据 库 辅助 设计 工具 。 

(2) 一 个 应 用 环境 里 包含 了 太 多 的 数据 (实体 及 联系 ) ,并且 还 要 求 建 立 元 数据 库 , 从 
而 使 得 人 工 设计 数据 库 已 经 不 可 能 。 

基于 以 上 因素 ,市场 上 产生 了 很 多 辅助 数据 库 设计 的 CASE 工具 ,如 Rational Rose、 
Power Designer .ERwin 等 。 这 些 工具 都 包含 以 下 特点 。 

(1) 图 形 化 。 数 据 库 设计 者 可 以 根据 软件 提供 的 图 形 表 示 法 (E-R/EER/UML/ 
ODL) 夯 出 概念 模型 图 。 

(2) 模型 映射 。 基 于 第 6 章 的 转换 规则 ,把 概念 模型 转化 为 迎 辑 模型 ,并 且 转 换 到 具 
体 RDBMS( 如 Oracle、SQL Server、.DB2 等 ) 下 的 SQL 文件 。 

大 多 数 的 数据 库 设计 工具 都 提供 物理 设计 功能 (如 设置 索引 ), 还 包含 一 些 性 能 检测 
工具 。 这 些 数据 库 辅助 设计 工具 都 有 易于 使 用 的 界面 、 良 好 的 设计 结果 展示 等 。 现 在 人 
们 越 来 越 重 视 采 用 工具 辅助 数据 库 设 计 , 并 且 越 来 越 意识 到 结构 化 设计 和 数据 库 应 用 设 
计 应 该 同时 进行 。 

表 7. 1 中 列 出 一 些 自动 化 的 数据 库 设计 辅助 工具 。 


表 7.1 数据 库 设 计 辅 助 工具 





公 司 工具 功 能 
Oracle Developer 2000 and designer 2000 | 数据 建 模 、 应 用 开发 
Rational Rational Rose UML 建 模 、 生 成 C++ 和 Java 应 用 程序 
Sybase Enterprise Application Suite 数据 建 模 、 商 业 建 模 
Visio Visio Enterprise 数据 建 模 ,设计 等 
Rogue Ware RW Metro 面向 对 象 到 关系 模型 的 转换 
Resolution Ltd XCase 概念 模型 到 代码 维护 
Embarcadero Technologies | ER Studio E-R 建 模 
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UML 类 图 建 模 


7.6 小 结 

本 章 讲 述 概念 模型 设计 的 UML 类 图 表示 法 (UML 类 图 表示 法 包含 类 、 关 联 、 父 类 / 
子 类 等 ) ,结合 前 面 的 公司 数据 库 例子 介绍 UML 类 图 ,并 讲述 了 UML 类 图 中 各 种 元 素 
到 关系 模型 的 转换 方式 。 
7.7 习题 


1. UML 类 图 中 的 类 ,关联 表示 什么 ”用 什么 符号 表示 ? 
2. 把 图 7.14 所 示 的 EER 图 用 UML 类 图 表示 。 


电影 




















图 7.14 电影 父 类 ,. 子 类 EER 图 


3. 把 第 2 题 的 UML 类 图 转换 为 关系 模型 。 
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第 8 章 ”关系 数据 理论 


数据 库 设 计 方法 有 多 种 ,可 以 根据 需求 分 析 抽 象 出 概念 模型 (E-R/EER/UML/ 
ODL) ,再 转换 为 逻辑 模型 (关系 模型 ); 也 可 以 从 需求 分 析 直 接 定义 出 关系 模型 。 但 是 ， 
不 管 以 下 哪 种 情况 ,初始 获得 的 关系 模式 都 需要 改进 。 

(1) 从 E-R 图 到 关系 模型 ,因为 不 好 的 E-R 图 将 导致 不 好 的 关系 模型 。 

(2) 直接 定义 的 一 个 关系 里 面包 含 很 多 属性 ,显然 不 是 一 个 好 的 关系 模型 。 

(3) 验证 一 个 关系 是 否 满足 某 一 级 别 的 规范 化 程度 。 

本 章 主要 介绍 如 何 运用 规范 化 理论 构建 一 个 良好 的 关系 数据 库 模 式 。 规 范 化 理论 俗 
称 3NF 理论 。 


8.1 规范 化 理论 概述 


为 什么 需要 规范 化 理论 ? 数据 库 设计 根据 需求 分 析 规 划 出 概念 模型 ,把 E-R 图 转换 
为 关系 模型 ,是 不 是 数据 库 设 计 就 完成 了 呢 ? 下 面 分 别 是 3 个 学 生 为 高 校 学 生 选 课 设计 
的 关系 模式 并 给 出 了 一 些 数据 ,下 面 线 为 主键 ,如 表 8. 1 一 表 8. 3 所 示 。 

studentl(sno( 学 号 ), sdept( 所 在 系 ), dname( 系 主任 ),cname( 课 程 名 ), grade 
(成 绩 )) 

student2(sno( 学 号 ),sname( 姓 名 ) ,sage( 年 龄 ),sdept( 所 在 系 ), dname( 系 主任 )， 
cname( 课 程 名 ) ,grade( 成 绩 )) 

student3(sno( 学 号 ) ,sname( 姓 名 ) ,sage( 年 龄 ),sdept( 所 在 系 ),dname( 系 主任 )， 
cno( 课 程 号 ) ,cname( 课 程 名 ) ,grade( 成 绩 )) 


表 8.1 studentl 表 

















sno sdept dname cname grade 
160640101 计算 机 李 宏 数据 库 87 
160640102 计算 机 李 宏 数据 库 89 
160640101 计算 机 李 宏 数据 结构 88 
160640102 计算 机 李 宏 数据 结构 85 
160640103 计算 机 李 宏 数据 库 84 
160640104 计算 机 李 宏 数据 库 80 
160640104 计算 机 李 宏 数据 结构 83 
160640105 计算 机 李 宏 数据 库 79 
160640105 计算 机 李 宏 数据 结构 67 
160640105 计算 机 李 宏 C+H+ 88 


关系 数据 理论 





sno sname sage sdept dname cname grade 
160640101 张 春 花 18 计算 机 李 宏 数据 库 87 
160640102 李 丽 19 计算 机 李 宏 数据 库 89 
160640101 张 春 花 18 计算 机 李 宏 数据 结构 88 
160640102 李 丽 19 计算 机 李 宏 数据 结构 85 
160640103 刘 冬 梅 18 计算 机 李 宏 数据 库 84 
160640104 崔 伟 17 计算 机 李 宏 数据 库 80 
160640104 崔 伟 多 计算 机 李 宏 数据 结构 83 
160640105 陈 立 20 计算 机 李 宏 数据 库 79 
160640105 陈 立 20 计算 机 李 宏 数据 结构 67 
160640105 陈 立 20 计算 机 李 宏 C++ 88 

















表 8.3 student3 表 


























sno sname sage sdept dname cno cname grade 
160640101 张 春 花 18 计算 机 李 宏 5 数据 库 87 
160640102 李 丽 19 计算 机 李 宏 5 数据 库 89 
160640101 张 春 花 18 计算 机 李 宏 3 数据 结构 88 
160640102 李 丽 19 计算 机 李 宏 3 数据 结构 85 
160640103 刘 冬 梅 18 计算 机 李 宏 日 数据 库 84 
160640104 崔 伟 17 计算 机 李 宏 5 数据 库 80 
160640104 崔 伟 17 计算 机 李 宏 3 数据 结构 83 
160640105 陈 立 20 计算 机 李 宏 5 数据 库 Te 
160640105 陈 立 20 计算 机 李 宏 3 数据 结构 67 
160640105 陈 立 20 计算 机 李 宏 7 C++ 88 


很 显然 ,从 给 出 的 关系 实例 来 看 ,这 3 个 学 生 设计 的 关系 模式 都 存在 以 下 问题 。 

(1) 数据 宛 余 。 如 重复 存放 系 名 、 系 主任 的 名 字 ,学 生 的 名 字 、 课 程 的 名 字 , 导 致 数据 
宛 余 ,浪费 存储 磁盘 ,并 且 容 易 导 致 存储 数据 的 内 容 不 一 致 

(2) 更 新 异常 。 由 于 数据 元 余 , 因 此 更 新 数据 的 时 候 也 有 可 能 会 导致 数据 不 一 致 。 
例如 , 当 某 个 学 生 转 系 ,那么 这 个 学 生 的 所 有 记录 都 需要 修改 ;再 如 ,换届 选举 更 改 系 主 
任 ,那么 所 有 记录 的 系 主任 信息 全 部 都 需要 修改 , 若 某 些 行 没有 发 生 修改 , 则 会 出 现 数据 
不 一 致 的 情况 。 

(3) 插入 异常 。 插 入 数据 时 ,如 果 主 属性 为 空 ,就 不 能 添加 数据 ,如 在 studentl 和 
student2 模式 中 ,主键 为 学 号 和 课程 名 , 当 来 了 一 个 新 生 , 如 果 没 有 选课 ,就 无 法 插 和 人 数 
据 ; 如 果 新 成 立 一 个 系 , 尚 无 学 生 ,就 无 法 将 这 个 系 的 信息 存 和 数据库; 如 果 新 开设 一 门 课 
程 ,还 没有 学 生 选 修 , 同 样 也 无 法 将 课程 信息 插入 数据 库 。 

(4) 删除 异常 。 当 删除 数据 时 ,所 有 的 学 生 信息 都 没有 了 ,课程 信息 、 系 、 系 主任 的 信 
息 都 随 着 丢失 。 这 些 问 题 是 怎么 造成 的 呢 ? 因 为 存在 数据 依赖 , 即 属性 之 间 存 在 值 相互 
制约 .相互 影响 的 关系 , 某 部 分 属性 的 值 决 定 其 他 属性 的 值 ,例如 ,学 号 的 值 一 旦 确定 ,对 
应 这 个 学 生 的 姓名 也 就 确定 了 ;又 如 , 系 名 一 旦 确定 了 ,我 们 也 就 知道 谁 是 这 个 系 的 系 主 
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丁 予 。 


学 习 数 据 依赖 的 理论 可 以 检验 一 个 关系 模型 设计 并 做 出 改进 。 数 据 依 赖 主要 包含 函 
数 依赖 ,多 值 依赖 .连接 依赖 ,以 及 其 他 一 些 不 常见 的 依赖 (在 本 章 不 做 介绍 ,如 包含 依赖 
等 )。 可 以 利用 本 章 所 学 的 规范 化 理论 对 关系 模式 做 相应 的 分 解 ( 即 用 若干 关系 代替 原 关 
系 ,这 些 关 系 的 属性 集合 包含 了 原 关系 的 所 有 属性 ) ,消除 其 中 不 合适 的 数据 依赖 ,从 而 减 


少数 据 宛 余 .消除 异常 。 


例如 ,将 studentl 分 解 为 如 下 形式 。 


studentl1(sno( 学 号 ), cname( 课 程 名 ) ,grade( 成 绩 )) 
student12(sno( 学 号 ) ,sdept( 所 在 系 )) 
student13(sdept( 所 在 系 ),dname( 系 主任 )) 


详细 情况 如 表 8. 4 一 表 8.6 所 示 。 


表 8.4 studentll 表 




















sno cname grade 
160640101 数据 库 87 
160640102 数据 库 89 
160640101 数据 结构 88 
160640102 数据 结构 85 
160640103 数据 库 84 
160640104 数据 库 80 
160640104 数据 结构 83 
160640105 数据 库 79 
160640105 数据 结构 67 
160640105 C++ 88 
表 8.5 student12 
sno sdept 

160640101 计算 机 

160640102 计算 机 

160640103 计算 机 

160640104 计算 机 

160640105 计算 机 

表 8.6 student13 
sdept dname 
计算 机 李 宏 
将 student2 分 解 为 如 下 形式 。 


student21(sno( 学 号 ) ,sname( 姓 名 ) ,sage( 年 龄 ) ,sdept( 所 在 系 )) 
student22(sdept( 所 在 系 ),dname( 系 主任 )) 
student23(sno( 学 号 ) ,cname( 课 程 名 ) ,grade( 成 绩 )) 
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详细 情况 如 表 8.7 一 表 8. 9 所 示 。 


表 8.7 student21 


关系 数据 理论 





sno sname sage sdept 
160640101 张 春 花 18 计算 机 
160640102 李 丽 19 计算 机 
160640103 刘 冬 梅 18 计算 机 
160640104 崔 伟 1 计算 机 
160640105 陈 立 20 计算 机 


表 8.8 student22 























sdept dname 
计算 机 李 宏 
表 8.9 student23 
sno cname grade 
160640101 数据 库 87 
160640102 数据 库 89 
160640101 数据 结构 88 
160640102 数据 结构 85 
160640103 数据 库 84 
160640104 数据 库 80 
160640104 数据 结构 83 
160640105 数据 库 79 
160640105 数据 结构 67 
160640105 C++ 88 
将 student3 分 解 为 如 下 形式 。 
student31(sno( 学 号 ) ,sname( 姓 名 ) ,sage( 年 龄 ) ,sdept( 所 在 系 )) 
student32(sdept( 所 在 系 ) ,dname( 系 主任 )) 
student33(cno( 课 程 号 ) ,cname( 课 程 名 )) 
student34(sno( 学 号 ) ,cno( 课 程 号 ) ,grade( 成 绩 )) 
详细 情况 如 表 8. 10 一 表 8. 13 所 示 。 
表 8.10 student31 
sno sname sage sdept 
160640101 张 春 花 18 计算 机 
160640102 李 丽 19 计算 机 
160640103 刘 冬 梅 18 计算 机 
160640104 崔 伟 17 计算 机 


160640105 陈 立 20 计算 机 
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表 8.11 student32 表 8.12 student33 
sdept dname cno cname 
计算 机 李 宏 5 数据 库 
3 数据 结构 
7 C++ 


表 8.13 student34 





Sno cno grade 
160640101 5 87 
160640102 5 89 
160640101 3 88 
160640102 3 85 
160640103 5 84 
160640104 5 80 
160640104 3 83 
160640105 5 79 
160640105 3 67 
160640105 时 88 








分 解 后 的 每 个 关系 模式 ,其 属性 间 的 依赖 大 大 减少 ,异常 问题 . 宛 余 问题 也 大 大 减少 。 
因此 ,一 个 好 的 关系 模式 应 该 具备 以 下 4 个 条 件 。 

(1) 尽 可 能 少 的 元 余 。 

(2) 没有 插入 异常 。 

(3) 没有 删除 异常 。 

(4) 没有 更 新 异常 。 

由 于 异常 问题 .元 余 问题 一 直 是 影响 系统 性 能 的 重大 问题 ,所 以 规范 化 理论 是 关系 数据 
库 设计 的 重要 部 分 。 当 然 , 对 于 其 他 的 逻辑 数据 模型 ,该 规范 化 理论 还 需要 进一步 研究 。 


8.2 ”基本 概念 


在 数据 依赖 中 ,函数 依赖 是 最 常见 的 一 种 依赖 。 它 反映 属性 或 者 属性 组 之 间 相互 影 
响 、 制 约 的 关系 。 本 节 将 介绍 以 下 有 关 函 数 依赖 的 几 个 概念 。 


1. 函数 依赖 


定义 8.1 设 R(D) 是 一 个 关系 模式 ,U 是 R 的 属性 集合 ,X.Y 是 U 的 子 集 。 对 于 
R(U) 的 任意 一 个 可 能 的 关系 ,如果 中 不 存在 任意 两 个 元 组 ,它们 在 X 上 的 属性 相同 ， 
而 在 Y 上 的 属性 不 同 , 则 称 *X 函数 决定 Y” 或 “Y 函数 依赖 于 X”, 记 作 X>Y。 

说 明 : 

(1) 该 定义 是 对 RR 中 所 有 关系 实例 而 言 的 。 

(2) 数据 库 设 计 者 可 对 关系 进行 强制 规定 ,如 姓名 不 能 同名 。 
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(3) 如 X-~Y, 则 X 称 为 决定 属性 集 。 

(4) 如 XY 了 ,并 且 Y 一 X, 则 记 为 X 一 一 Y。 

(5) 若 了 不 函数 依赖 于 X , 则 记 作 X_ Y。 

例如 ,对 于 学 生 关 系 student (sno, sname, sex, sage, sdept); sno 为 码 , 则 有 sno 一 
sname,sno>sex, sno 阅 sage,sno 习 sdept; 即 sno 函数 决定 sname,sno 函数 决定 sex, 或 者 
sage 孜 数 依赖 于 sno。 


2. 非 平凡 的 函数 依赖 和 平凡 的 函数 依赖 


定义 8.2 关系 模式 R(U) 中 ,U 是 R 的 属性 集合 ,XY 是 UU 的 子 集 ,如 果 X>Y, 但 Y 
不 包含 于 X, 则 称 X>Y 是 非 平凡 函数 依赖 , 若 Y 包含 于 义 , 则 称 X>Y 是 平凡 函数 依赖 。 

说 明 : 

(1) 对 任 一 关系 模式 ,平凡 函数 依赖 必然 成 立 。 

(2) 本 节 只 讨论 非 平凡 函数 依赖 。 

(3) 非 平凡 函数 依赖 易 产生 前 面 提 到 的 数据 元 余 及 异常 问题 。 

对 于 关系 模式 student(sno, sname, sex, sage, sdept) 、sc(sno,cno,grade) ,存在 非 平 
凡 的 函数 依赖 ,如 sno~>sname,(sno,cno)~>grade; 存 在 平凡 的 函数 依赖 ,如 (sno,sname) 一 


sno;(sno,sname)>sname;(sno,sage)™ sage,。 
3. 完全 函数 依赖 和 部 分 函数 依赖 


定义 8.3 在 关系 模式 R(U) 中 ,U 是 R 的 属性 集合 ,X、Y 是 U 的 子 集 。 如 果 X-~Y， 
并 且 对 于 X 的 任何 一 个 真子 集 Xi ,都 有 XY, 则 称 *Y 完全 函数 依赖 于 X”, 记 作 


X 二 Y。 若 Xi 一 Y,Y 不 完全 函数 依赖 于 X, 则 称 Y 部 分 函数 依赖 于 X, 记 作 X 二 Y。 
说 明 : 
(1) 部 分 函数 依赖 易 产生 前 面 提 到 的 数据 元 余 及 异常 问题 。 
(2) 完全 函数 依赖 中 ,X 为 决定 属性 集 ,Y 为 被 决定 属性 集 。 
对 于 关系 模式 student(sno,sname,sex,sage,sdept,cno,grade) ,存在 完全 函数 依赖 ， 
如 (sno,cno) 一 grade; 存 在 部 分 函数 依赖 ,如 (sno,sname)-~sage。 





4. 传递 函数 依赖 
定义 8.4 在 关系 模式 R(U) 中 ,如 果 XY,Y 一 2Z, 且 Y 生 X,Y X,ZSY, 则 称 "Z 


传递 函数 依赖 于 X”, 记 作 X 上 时 Z。 
对 于 关系 模式 student(sno,sdept,location,cno, grade) ,其 中 location 为 宿舍 地 址 ， 


传递 
sno~sdeptysdept-~>location ,存在 传递 函数 依赖 sno 一 >location。 
5. 码 


设 KK 为 关系 模式 R(U,F) 中 的 属性 或 属性 组 。 若 K 完全 函数 决定 器 , 则 称 天 是 一 
个 候选 码 ; 若 开 部 分 函数 决定 UU, 则 称 K 为 超 码 ; 若 关系 模式 R 有 多 个 候选 码 , 则 须 选 定 
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其 中 一 个 为 主 码 。 


8.3 范式 


关系 数据 库 中 的 关系 是 要 满足 一 定 要 求 的 ,满足 不 同 要 求 的 为 不 同 规范 化 程度 的 范 
式 。 满 足 最 低 要 求 的 为 第 一 范式 ,简称 INF; 在 第 一 范式 中 满足 进一步 要 求 的 为 第 二 范 
式 ,简称 2NF; 其 余 的 依次 类 推 。 

范式 : 是 指 符合 某 一 规范 化 级 别 的 关系 模式 的 集合 。 

目前 主要 有 6 种 范式 : 

1NFDO2NFO3NFOBCNFO4NFOS5NF 

6 种 范式 的 规范 化 程度 依次 增强 ,满足 后 一 种 范式 的 关系 模式 必然 满足 前 一 种 范式 。 

关系 模式 的 创始 人 E. FF. Codd 于 1971 年 到 1972 年 间 提 出 了 1NF、2NF、3NF。1974 
年 ,E.F. Codd 与 Boyce 合作 提出 了 BCNF。 随 后 ,规范 化 理论 进一步 发 展 ,又 有 其 他 研 
究 人 员 相 继 提出 4NF、5NF。 

把 一 个 满足 低 一 级 范式 的 关系 模式 通过 模式 分 解 转化 为 若干 个 满足 高 一 级 范式 的 关 
系 模 式 的 集合 ,这 种 过 程 叫 作 规范 化 。 规 范 化 程度 越 高 ,元 余 越 少 ,异常 也 越 少 。 








8.3.1 第 一 范式 


定义 8.5 如果 一 个 关系 模式 R 的 所 有 属性 是 不 可 再 分 的 基本 数据 项 , 则 RE 1NF。 
表 8. 14 一 表 8. 16 都 不 满足 LNF ,是 非 规范 化 的 关系 。 要 变 成 规范 化 的 关系 ,只 将 复 


表 8.14 职工 关系 表 一 
































王 . 蓝 
职工 号 姓 名 
基本 工资 岗位 工资 绩效 工资 
20170201 李 书 香 1600 980 1200 
表 8.15 职工 关系 表 二 
职工 号 姓 名 职 称 性 和 别 学 历 
大 学 生 
E001 李鹏 举 教授 研究 生 
E002 刘 宏 武 副教授 男 研究 生 
表 8.16 职称 表 一 
高 级 职称 人 数 
院 名 称 
教 授 副 教 授 
信息 学 院 8 14 
文学 院 6 12 
理学 院 ka 10 











106 














第 8 章 乃 所 
合 属性 变 成 简单 属性 即 可 。 例 如 ,将 表 8. 16 转换 成 表 8. 17。 
表 8.17 职称 表 二 
院 名 称 教授 人 数 副教授 人 数 
信息 学 院 8 14 
文学 院 6 12 
理学 院 10 


满足 1NF 的 关系 模式 并 不 一 定 是 一 个 好 的 关系 模式 。 例 如 ,本 章 开始 3 个 学 生 设 计 
的 关系 studentl student2 .student3 都 满足 1NF, 但 是 存在 数据 元 余 、 更 新 异常 .插入 异 
常 ,删除 异常 。 这 几 种 问题 已 在 8. 1 节 中 介绍 过 。 


8.3.2 第 三 范式 


定义 8.6 若 关系 模式 RE1INF, 并 且 每 个 非 主 属性 都 完全 函数 依赖 于 尺 的 码 , 则 称 
RE2NF, 即 不 存在 非 主 属性 对 码 的 部 分 函数 依赖 。 

例如 ,对 学 生 关 系 SDC(sno,sdept, dname,cname,grade) ,主键 为 (sno,cname) ,存在 
函数 依赖 如 图 8. 1 所 示 。 











Sno cname -一 grade 












































dname 














sdept 








8.1 学 生 关系 函数 依赖 


由 于 存在 非 主 属性 sdept 对 主键 的 部 分 依赖 ,所 以 属于 1NF。 对 其 进行 分 解 , 将 违反 
2NF 的 部 分 函数 依赖 单独 作为 一 个 关系 ,如 下 : 

SD(sno, sdept, dname) 

SC(sno,cname, grade) 

分 解 为 SD 和 SC, 在 关系 SC 中 就 不 存在 任何 非 主 属性 对 码 的 部 分 函数 依赖 了 , 它 已 
经 属于 2NF; 而 SD 中 也 不 再 存在 非 主 属性 对 码 的 部 分 函数 依赖 ,也 已 经 属于 2NF, 但 是 
在 SD 中 存在 函数 依赖 如 图 8. 2 所 示 。 


和 sdept sdept 
sno | sno ”| 
Ne dname dname 


图 8.2 表 SD 的 函数 依赖 
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SDC 分 解 后 元 余 减 少 ,异常 情况 减少 ,分 别 如 表 8. 18 和 表 8. 19 所 示 。 在 关系 SD 
中 , 系 主任 的 名 字 重 复 的 次 数 比 未 分 解 之 前 大 大 减少 。 

















表 8.18 关系 SD 
sno sdept dname 
160640101 计算 机 李 宏 
160640102 计算 机 李 宏 
160640103 计算 机 李 宏 
160640104 计算 机 李 宏 
160640105 计算 机 李 宏 
表 8.19 关系 SC 
sno cname grade 
160640101 数据 库 87 
160640102 数据 库 89 
160640101 数据 结构 88 
160640102 数据 结构 85 
160640103 数据 库 84 
160640104 数据 库 80 
160640104 数据 结构 83 
160640105 数据 库 79 
160640105 数据 结构 67 
160640105 C++ 88 


从 以 上 分 解 及 分 析 过 程 看 出 ,消除 非 主 属性 对 码 的 部 分 依赖 ,可 以 减少 元 余 和 异常 ， 
并 可 以 总 结 出 由 1NF 分 解 为 2NF 的 非 形式 化 的 方法 。 

设 关系 模式 R(U) , 主 码 是 天,R 上 还 存在 函数 依赖 X 一 Y, 其 中 Y 是 非 主 属性 ,并 且 
XCK ,那么 就 说 明 存在 Y 部 分 依赖 于 主 码 K。 可 以 把 RR 分 解 为 两 个 模式 ， 

Ri1(X,Y) ,关系 模式 Ri 的 主键 为 X。 

R:(2Z) ,其 中 Z=U 一 Y( 即 U 中 除去 Y 后 剩 下 的 属性 ) ,主键 仍然 是 玉 8。 外 键 是 X, 它 
在 Ri 中 是 主键 。 

利用 主键 和 外 键 可 以 使 R 和 R, 连接 得 到 R。 

因此 ,通过 将 依赖 于 主 属性 的 部 分 函数 依赖 单独 构成 新 的 关系 ,可 将 INF 分 解 
为 2NF。 

推论 : 如 果 关 系 R 所 有 的 码 中 只 包含 一 个 属性 且 属 于 1NF, 则 RR 必 属 于 2NF。 

虽然 如 此 ,但 关系 模式 SD(sno,sdept,dname) 仍 存在 操作 异常 (如 元 余 大 、 更 新 异常 、 
插入 异常 .删除 异常 ) 的 情况 。 系 主任 的 名 字 仍 然 要 重复 多 次 ,其 重复 的 次 数 和 系 里 的 学 
生 人 数 一 样 多 。 导 致 这 个 问题 的 原因 是 还 存在 着 其 他 的 函数 依赖 ,因此 2NF 不 是 最 优 
范式 。 
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8.3.3 第 三 范式 


定义 8.7 若 关系 模式 R<U,F> 中 不 存在 候选 码 X、 属 性 组 Y, 以 及 非 主 属 性 Z(Z 
不 包含 于 Y) ,使 得 X>Y,Y>Z 和 Y X 成立, 则 RE3NF。 

若 RE3NF, 则 R 的 每 个 非 主 属性 既 不 部 分 函数 依赖 于 候选 码 , 也 不 传递 函数 依赖 于 
候选 码 。 

在 关系 SD(sno, sdept, dname) 中 ,存在 非 主 属性 对 码 的 传递 依赖 , 即 sno 一 sdept， 
sdept>dname, 因 此 dname 传递 依赖 于 sno ,该 关系 不 属于 3NF。 

对 关系 SD(snoysdept,dname) 进 一 步 分 解 ,将 违反 3NF 的 dname 对 sno 的 传递 依赖 
单独 拿 出 来 构成 一 个 关系 ,分 解 为 

SS(sno, sdept) DN(sdept, dname) 

分 解 后 ,SS 和 DN 的 函数 依赖 如 图 8. 3 所 示 。SS(sno,sdept) .DN(sdept, dname) 都 
属于 3NF。 其 数据 分 别 如 表 8. 20 和 表 8. 21 所 示 。 


sdept Sno =| sdept 
sno KC | = 
dname sdept “上 一 一 dname 


图 8.3 SS 和 DN 的 函数 依赖 
























































系 主任 的 名 字 只 需 保存 一 次 。 分 解 后 在 一 定 程度 上 解决 了 数据 元 余 大 、 更 新 异常 插 





人 异常 ,删除 异常 的 问题 。 
表 8.20 关系 SS 表 8.21 关系 DN 
sno sdept sdept dname 
160640101 计算 机 计算 机 李 宏 
160640102 计算 机 
160640103 计算 机 
160640104 计算 机 
160640105 计算 机 





从 以 上 分 析 过 程 可 以 得 出 2NF 分 解 为 3NF 的 非 形式 化 的 方法 。 
设 关系 模式 R(U) ,主键 K,R 上 还 存在 着 函数 依赖 XY,Y 是 非 主 属性 ,了 不 是 X 的 
子 集 ( 即 Y 守 X),X 不 是 候选 键 ,因此 Y 传递 依赖 于 主键 扩 。 把 关系 R 分 解 为 两 个 模式 : 
R(X,Y) ,主键 是 X; 
R: (2Z) ,其 中 Z=U 一 Y ,主键 仍 然 是 ,外 键 是 处 ,而 六 在 Ri 中 是 主键 。 
利用 主键 和 外 键 可 以 使 得 R 和 FR, 连接 得 到 R。 
推论 : 不 存在 非 主 属性 的 关系 模式 一 定 属于 3NF。 
3NF 并 不 一 定 就 是 一 个 好 的 关系 模式 。 因 为 它 并 不 能 完全 消除 异常 情况 和 数据 元 
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余 。 还 有 可 能 存在 “ 主 属性 ”部 分 函数 依赖 或 传递 函数 依赖 于 码 的 情况 。 
8.3.4 BCNF 


定义 8.8 若 关系 模式 RU ,FE€1NF, 如 果 对 于 R 的 每 个 函数 依赖 XY, 若 Y 
不 包含 于 X, 且 X 必 含 有 候选 码 , 那 么 REBCNF。 

即 在 关系 模式 R<U,F 二 中 ,如 果 每 个 决定 属性 都 包含 候选 码 , 则 RE BCNF。 

即 在 3NF 的 基础 上 ,消除 了 主 属性 对 码 的 部 分 依赖 和 传递 依赖 ,所 有 属性 都 不 部 分 
依赖 或 传递 依赖 于 码 。 

【 例 8.1】 STJ(CS,T,J) 中 ,S 表示 学 生 ,T 表示 教师 ,J] 表示 课程 。 假 车 每 名 教师 只 
教 一 门 课 , 每 门 课 有 若干 教师 教 , 某 一 学 生 选 定 某 门 课 就 确定 了 一 个 固定 的 教师 。 

STJ 中 存在 两 个 候选 码 (S,J) 和 (S,T) , 它 存 在 以 下 数据 依赖 : (S,J) 一 T,(S,T) 一 ]， 
T-~J。 该 关系 不 存在 非 主 属性 ,因此 STJ 属于 3NF。 但 是 ,STJ 中 存在 主 属性 本部 分 依 
赖 于 码 (S,T) ,因此 它 不 属于 BCNF。 如 表 8. 22 所 示 ,该 模式 仍 存在 以 下 情况 : 数据 宛 余 
太 大 、 更 新 异常 .插入 异常 .删除 异常 。 


表 8.22 学 生 教师 课程 表 














学 生 教 师 课 程 
张 伟 何 宇 数据 库 
李 飞 何 宇 数据 库 
王 冰 何 宇 数据 库 
张 伟 郑 林 数据 结构 
李 飞 郑 林 数据 结构 
王 冰 郑 林 数据 结构 
李 飞 王宏伟 计算 机 网 络 
王 冰 王宏伟 计算 机 网 络 


对 STJ 分 解 , 将 违反 BCNF 的 函数 依赖 单独 组 成 一 个 关系 ,转化 为 ST(S,T) 和 
TJ(T,J) ,其 数据 分 别 如 表 8. 23 和 表 8. 24 所 示 。 分 解 后 ,消除 了 上 述 几 种 异常 情况 。 





表 8.23 学 生 与 教师 的 关系 表 8.24 教师 与 课程 
学 生 教师 教师 课程 

张 伟 何 字 何 字 数据 库 

李 飞 何 字 郑 林 数据 结构 

王 冰 何 字 王宏伟 计算 机 网 络 

张 伟 郑 林 

李 飞 郑 林 

王 冰 郑 林 

李 飞 王宏伟 

王 冰 王宏伟 
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BCNF 具有 以 下 3 个 性 质 。 

(1) 所 有 非 主 属性 都 完全 函数 依赖 于 每 个 候选 码 。 

(2) 所 有 主 属性 都 完全 函数 依赖 于 每 个 不 包含 它 的 候选 码 。 

(3) 没有 任何 属性 完全 函数 依赖 于 非 码 的 任何 一 组 属性 。 

推论 : 如 果 R 中 只 有 一 个 候选 码 ,上 且 RE3NF, 则 必 有 REBCNF。 

3NF 和 BCNF 是 以 函数 依赖 为 基础 的 关系 模式 规范 化 程度 的 测度 。 如 果 一 个 关系 
数据 库 中 的 所 有 关系 模式 都 属于 BCNF ,那么 在 函数 依赖 范畴 内 , 它 已 实现 了 模式 的 彻底 
分 解 ,达到 了 最 高 的 规范 化 程度 。 

【 例 8. 2】 回 到 本 章 开 始 第 3 个 学 生 设 计 的 学 生 数 据 库 表 , 对 其 进行 规范 化 。 

student3(sno( 学 号 ) ,sname( 姓 名 ) ,sage( 年 龄 ) ,sdept( 所 在 系 ),dname( 系 主任 )， 
cno( 课 程 号 ) ,cname( 课 程 名 ) ,grade( 成 绩 )) ,姓名 有 可 能 重 名 ,假设 课程 名 不 存在 重 名 ， 
在 该 关系 中 存在 两 个 码 (sno,cno) 和 (sno,cname) ,还 存在 以 下 函数 依赖 ， 

sno™Y (sdept, sname, sage) 

sdept>dname 

cno 一 cname 

cname>cno 

(sno,cno)>grade 

(sno,cname)>grade 

根据 前 面 所 学 的 非 形 式 化 的 方法 对 它 进行 分 解 。 

第 一 步 规范 化 为 INF, 由 于 该 关系 模式 已 经 为 INF, 所 以 不 需要 再 分 解 。 

第 二 步 规范 化 为 2NF ,去 除非 主 属性 对 码 的 部 分 依赖 ,分 解 为 2NF。 存 在 非 主 属性 
“sdept, sname,sage,dname” 对 码 的 部 分 依赖 ,因此 它们 单独 组 成 一 个 关系 student31。 剩 
下 的 属性 构成 一 个 关系 ,为 student32。 

student31(sno( 学 号 ) ,sname( 姓 名 ) ,sage( 年 龄 ),sdept( 所 在 系 ),dname( 系 主任 )) 

student32(sno( 学 号 ) ,cno( 课 程 号 ) ,cname( 课 程 名 ) ,grade( 成 绩 )) 

第 三 步 规范 化 为 3NF ,去 除非 主 属性 对 码 的 传递 依赖 ,分 解 为 3NF。 在 student32 中 
不 存在 传递 依赖 ,因此 它 已 经 是 3NF。 在 student31 中 存在 非 主 属性 dname 对 码 sno 的 
传递 依赖 ,单独 组 成 一 个 关系 。 因 此 ,student31 转化 为 student311 和 student312 ,转化 后 
的 结果 如 下 : 

student32(sno( 学 号 ) ,cno( 课 程 号 ) ,cname( 课 程 名 ) ,grade( 成 绩 )) 

student311(sno( 学 号 ) ,sname( 姓 名 ) ,sage( 年 龄 ),sdept( 所 在 系 )) 

student312(sdept( 所 在 系 ).dname( 系 主任 )) 

最 后 ,判断 分 解 后 的 3 个 关系 模式 是 否 属于 BCNF。 在 student32 关系 中 存在 cno 一 一 
cname, 即 主 属性 对 码 的 部 分 依赖 ,因此 分 解 为 如 下 形式 : 

student321(sno( 学 号 ) ,cno( 课 程 号 ) ,grade( 成 绩 )) 

student322(cno( 课 程 号 ) ,cname( 课 程 名 )) 

student311(sno( 学 号 ) ,sname( 姓 名 ) ,sage( 年 龄 ) ,sdept( 所 在 系 )) 

student312(sdept( 所 在 系 ) ,dname( 系 主任 )) 
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对 以 上 每 个 关系 进行 判断 ,发 现 都 属于 BCNF ,在 函数 依赖 范围 内 已 经 达到 最 高 级 别 。 
8.3.5 多 值 依赖 与 第 四 范式 


关系 模式 TEACH(C,T,B) ,其 中 C 表示 课程 ,T 表示 教师 ,B 表示 参考 书 , 如 表 8. 25 





所 示 。 
表 8.25 课程 教师 参考 书 

C( 课 程 ) T( 教 师 ) B( 参 考 书 ) 
数学 邓 海 高 数 
数学 邓 海 数学 分 析 
数学 邓 海 微分 方程 
数学 陈 红 高 数 
数学 陈 红 数学 分 析 
数学 陈 红 微分 方程 
物理 李 东 普通 物理 学 
物理 李 东 光学 








假设 某 门 课 由 多 个 教师 讲授 ,一 门 课 使 用 相同 的 一 套 参考 书 , 则 存在 以 下 依赖 ; 

数学 一 [ 邓 海 , 陈 红 ]-~[ 高 数 , 数 学 分 析 ,微分 方程 ] 

物理 一 [ 李 东 , 张 强 , 刘 明 ]-~[ 普 通 物理 学 ,光学 ] 

该 关系 模式 的 码 为 全 码 (C,T,B) ,满足 BCNF, 但 仍 存 在 数据 元 余 和 3 种 异常 。 因 为 
该 关系 的 属性 间 存 在 一 种 不 同 于 函数 依赖 的 依赖 。 这 种 函数 依赖 有 以 下 两 个 特点 。 

(1) 设 R(D) 中 XX 与 Y 有 这 样 的 依赖 关系 , 当 XX 的 值 一 经 确定 后 ,就 可 以 有 一 组 Y 
值 与 之 对 应 。 如 确定 课程 , 则 有 一 组 教师 与 之 对 应 ;同样 ,课程 和 参考 书 之 间 也 有 类 似 的 
依赖 关系 。 

(2) 当 X 的 值 一 经 确定 ,就 有 一 组 对 应 的 立 值 ,但 与 U 一 X 一 YY 无 关 , 即 对 应 的 一 门 
课程 有 一 组 教师 与 之 对 应 ,而 与 参考 书 无 关 ; 这 表示 课程 与 教师 有 这 样 的 依赖 ,教师 的 值 
确定 与 U 一 课程 一 教师 一 参考 书 无 关 。 

我 们 称 以 上 这 种 依赖 为 多 值 依赖 。 


1. 多 值 依赖 


定义 8.9 设 R(U) 是 一 个 属性 集 U 上 的 一 个 关系 模式 ,X.Y 和 Z 是 UU 的 子 集 , 并 且 
Z==U 一 X 一 了 ,多 值 依赖 X 一 >Y 成 立 当 且 仅 当 对 R 的 任 一 关系 r,r 在 (X,Z) 上 的 每 个 
值 对 应 一 组 Y 的 值 ,这 组 值 仅仅 决定 于 XX 值 ,而 与 Z 值 无 关 。 

车 X>>Y, 而 Z 二 @B(G@ 表示 空 集 ), 则 X 一 >Y 为 平凡 的 多 值 依赖 。 否 则 称 XY 
为 非 平 凡 的 多 值 依赖 。 

多 值 依赖 的 另 一 个 定义 : 在 关系 模式 RC(U) 的 任 一 关系 中 ,如 果 对 于 任意 两 个 元 组 1、 
s,; 有 t[X] 二 s[Xj, 就 必 存 在 元 组 w,v€Erlw 和 w 可 以 与 ;和 zt 相同), 使 得 w[LX] 二 vLX] 二 
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t[Xj, 而 w[Y]j]==t[Yj,wL2Zj==s[Zj],v[LYj==s[Yj,vL2Zj==t[2Zj], 即 交换 st 元 组 的 Y 值 所 
得 的 两 个 新 元 组 必 在 > 中 , 则 称 Y 多 值 依赖 于 XX, 记 为 X 一 >Y。 其 中 ,XX 和 YY 是 U 的 子 
集 ,Z=U 一 X 一 Y。 

多 值 依赖 存在 以 下 性 质 。 

(1) 对 称 性 。 即 X 一 一 了, 则 X 一 一 Z, 其 中 Z=U 一 X 一 Y。 

(2) 传递 性 。 即 X>>Y, YZ, 则 X 一 >Z。 

(3) 函数 依赖 可 以 看 作 是 多 值 依赖 的 特殊 情况 。 

(4) 车 XY, X 一 一 2, 则 X 一 >YZ。 

(5) 若 X>>Y, X>>Z, 则 X>>Y 门 Z。 

(6) 若 X 一 一 Y，X 一 一 Z, 则 X 一 >Y 一 Z, X 一 一 Z 一 Y。 

(7) 多 值 依赖 的 有 效 性 与 属性 集 的 范围 有 关 。 

(8) 若 函 数 依赖 XY 在 R(U) 上 成 立 , 则 对 于 Y 包含 于 Y,X 一 习 Y' 并 不 一 定 成 立 ， 
但 是 如 果 函 数 依赖 XY 在 R(U) 上 成 立 , 对 于 任何 Y 包含 于 Y,X 一 Y 必定 成 立 。 








2. 4NF 


定义 8.10 关系 模式 R(U,F)E1NF, 如 果 对 于 R 的 每 个 非 平凡 多 值 依赖 X 一 一 Y 
(了 不 包含 于 X),X 都 含有 候选 码 , 则 RE 4NF。 

对 上 面 的 关系 模式 TEACH(C,T,B) 去 掉 违 反 4NF 定义 的 多 值 依赖 。 

分 解 为 两 个 关系 模式 ， 

CTCC,T)E4NF 

CB(C,B)E4NF 

分 解 后 的 两 个 关系 都 属于 4NF 。 

分 解 是 关系 规范 化 的 主要 手段 。 

【 例 8.3】 关系 模式 WPG(W,P,G) 中 ,W 表示 仓库 ,P 表示 仓库 保管 员 ,G 表示 产 
品 。 假 定 每 个 仓库 有 若干 个 保管 员 , 有 若干 种 产品 。 每 个 仓库 保管 员 保管 所 在 仓库 的 所 
有 产品 ,每 种 产品 被 所 有 仓库 保管 员 保管 ,判断 该 关系 是 否 属于 4NF。 

在 关系 WPG 中 , 码 为 全 码 , 且 存在 W 一 ~P,W-~~~~G 都 是 非 平凡 多 值 依赖 。 根 据 
4NF 的 定义 ,该 关系 不 是 4NF。 


“8.3.6 连接 依赖 与 SNF 

连接 依赖 是 有 关 分 解 和 自然 连接 的 理论 ,5NF 是 有 关 如 何 消除 子 关系 的 插入 异常 和 
删除 异常 的 理论 。 

1. 连接 依赖 


定义 8.11 设 R(U) 是 属性 集 U 上 的 关系 模式 ,X, ,X,,…,X, 是 U 的 子 集 , 且 U= 
XIUXsU…UX,, 如 R 等 于 R(X),R(X,),…,R(X,) 的 自然 连接 , 则 称 RR 在 XX， 
X;，… ,XX, 上 具有 7 目 连 接 依 赖 , 记 作 m(R(X1) .R(Xs),… ,R(X,))。 
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其 中 ,RCX) 一 II (R),RCX) 一 II (R)，…,RCX。) 一 IIx (R). 
2. SNF 


定义 8.12 如果 关系 模式 R 中 的 每 个 连接 依赖 均 由 R 的 候选 码 所 隐 含 , 则 称 R 
E5NF。 

说 明 : 

(1) 连接 时 所 连接 的 属性 均 为 候选 码 。 

(2) 多 表 间 的 连接 应 满足 5NF。 


8.3.7 规范 化 小 结 


分 解 关系 模式 的 目的 是 使 模式 更 加 规范 化 ,从 而 减少 数据 元 余 及 尽 可 能 地 消除 异常 。 
规范 化 的 结果 实际 上 就 是 使 得 每 个 关系 里 的 数据 单一 概念 化 ,也 就 是 说 ,一 个 关系 里 要 人 么 
保存 一 个 实体 的 相关 数据 ,要 么 保存 一 个 联系 的 相关 数据 ,而 不 是 把 实体 和 联系 的 数据 混 
合 在 一 起 ,造成 数据 元 余 。 

关系 模式 的 分 解 过 程 如 图 8.4 所 示 。 从 1NF 到 5NF 是 一 个 从 低 一 级 关系 模式 到 规 
范 化 程度 更 高 一 级 关系 模式 的 过 程 ,也 是 减少 数据 元 余 和 消除 异常 的 过 程 。 该 分 解 过 程 
可 以 根据 本 童 后 面 的 分 解 算法 进行 。 如 果 不 按照 分 解 算法 进行 规范 化 ,只 能 根据 人 为 经 









































验 进行 规范 化 。 
INF 
本 消除 非 主 属性 对 码 的 部 分 函数 依 末 
2NF 
et 二 消除 非 主 属性 对 码 的 传递 函数 依 末 
平凡 函数 信条 i 
消除 主 居 性 对 码 的 部 分 和 传 部 数 依赖 
LL BCNF 
】 消除 多 值 依 六 
4NF 
】 消除 连接 依 入 











5NF 





图 8.4 关系 模式 的 分 解 过 程 


8.4 Armstrong 公理 系统 


Armstrong 公理 系统 是 模式 分 解 算法 的 理论 基础 , 它 是 由 W. W. Armstrong 于 1974 
年 总 结 的 一 套 有 效 而 完备 的 公理 系统 。 
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1. 函数 依赖 集 的 逻辑 荀 酒 


问题 : 对 于 给 定 的 一 组 函数 依赖 ,如 何 判断 其 他 函数 依赖 是 否 成 立 ?” 例如 ,关系 模式 
有 RR 有 A~B,B 一 C。 函 数 依赖 A 一 C 是 否 成 立 ? 这 是 函数 依赖 集 的 逻辑 蕴涵 要 研究 的 
内 容 。 

定义 8.13 设 下 是 关系 模式 R<U, FF 二 的 函数 依赖 集 ,X、Y 是 R 的 属性 子 集 。 如 
果 在 RR<U, > 上 函数 依赖 XY 成 立 , 则 称 下 逻辑 蕴涵 XX 一 Y。 也 可 以 表述 为 , 若 从 下 
中 的 函数 依赖 能 够 推导 出 X-~Y, 则 下 逻辑 蕴涵 X->Y。 


2. 函数 依赖 集 的 闭 包 


定义 8.14 在 关系 模式 R<U, FF 二 中 ,下 逻辑 蕴涵 的 函数 依赖 的 全 体 称 为 下 的 闭 
包 , 记 作 FF*。 


3. Armstrong 公理 


关系 模式 RU, F 二 ,有 如 下 推理 规则 。 

Al: 自 反 律 (Reflexivity): 车 YCXCU, 则 XY 为 F 所 蕴涵 。 

简写 : 若 YCX, 则 XY。 

A2: 增 广 律 (Augmentation) : 若 X>Y 为 下 所 蕴涵 , 且 ZCU, 则 XZ>YZ 为 下 所 蕴涵 。 
简写 : 若 XY, 则 XZ-~YZ 。 

A3: 传递 律 (Transitivity): 车 XY 和 YZ 为 所 蕴涵 , 则 XZ 为 下 所 蕴涵 。 
简写 : 若 XY.Y>Z, 则 X 一 2Z。 


4. Armstrong 公理 的 推论 


(1) 合并 规则 : 由 XY,X 一 Z, 有 XYZ。 

(2) 分 解 规则 : 由 XY 及 ZCY, 有 XZ。 

(3) 伪 传 递 规 则 ; 由 XY,WY 一 Z, 有 XW>Z。 

有 了 上 述 推理 规则 ,对 于 一 个 给 定 的 函数 依赖 集 下 ,就 可 以 知道 哪些 函数 依赖 可 由 下 
推出 ,哪些 不 能 由 下 推出 ,能 由 下 推出 的 函数 依赖 有 多 少 。 

【 例 8.4】 设 关系 模式 R<U,F 二 ,其 中 U={X,Y,2Z},F=={X>Y,Y 一 2Z), 则 下 的 
闭 包 F+ 是 什么 ? 

由 自 反 律 可 以 知道 X>0,Y>0,Z>O0,X 一 X,Y>Y,Z>2; 由 增 广 律 可 以 推出 XZ 一 
YZ,XY>Y,X 一 XY; 由 传递 性 推出 X 一 Z。 所 有 的 函数 依赖 (43 个 函数 依赖 ) 如 表 8. 26 
所 示 。 


表 8.26 Ft 
X-~O XY-~O XZ>0 XYZ>0 Y>0 YZ>0 Z>0 
X=>X XY>X XZ XYZ=X YexY YZ>Y Z>Z 


XY>Y XY XYZ=>Y Y=2 Y=2 O09 
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XZ XYZ 一 Z YYZ YZ>YZ 
XXY XYZ>XY 
XXZ XYZ>XZ 


XYZ XYZ>YZ 
XXYZ XYZ 一 XYZ 





5. 属性 集 的 闭 包 


定义 8.15 设 关系 模式 R<U, F>,XSU,.X 关 于 函数 依赖 集 下 的 闭 包 为 Xr 一 
{ A | XA 能 由 下 根据 Armstrong 公理 推出 } 。 

对 于 关系 模式 R<U,，F>>,XSU,Xr 的 算法 如 下 。 

(1) XE 的 初始 值 为 X 。 

(2) 对 于 下 中 的 每 个 函数 依赖 A 一 Z, 如 果 ASX# , 则 把 Z 加 入 到 Xt 中 。 

(3) 重复 步骤 (2) ,直到 没有 其 他 属性 可 以 再 添加 进来 。( 一 般 来 说 ,直到 X# 的 值 不 
再 改变 时 或 者 X# 已 经 包含 全 部 属性 ) 

【 例 8.5】 设 F={AC>PE,PG—>A,BCE,A 一 P,GA 一 B,GC 一 A, PAB 一 G， 
AE>GB,DP>H},X=BG, 求 X# 。 

初始 值 为 X :== BG 

第 一 步 迭 代 : 在 正中 找 出 左边 是 {4B,G} 子 集 的 函数 依赖 ,只 有 B 一 CE, 因 为 B 是 X 
的 子 集 , 其 右边 属性 CE 可 以 加 入 进来 。 

+ :=BGUCE=BCEG 

由 于 初始 值 和 第 一 步 迭代 结果 不 相同 ,因此 进入 第 二 步 迭 代 。 

第 二 步 迭 代 ; 在 下 中 找 出 左边 是 {B,C,E,G} 子 集 的 函数 依赖 ,只 有 GC 一 A ,因为 GC 
是 XE 的 子 集 ,其 右边 属性 A 可 以 加 入 进来 。 

+ :=BCEGUA=ABCEG 

由 于 第 二 步 迭 代 和 第 一 步 迭 代 结 果 不 相 同 ,因此 进入 第 三 步 迭 代 。 

第 三 步 迭 代 ; 在 下 中 找 出 左边 是 {A,B,C,E,G}) 子 集 的 函数 依赖 ,AC 一 PE,A 一 P， 
GA 一 B,AE 一 GB 这 些 函 数 依赖 的 右边 属性 都 可 以 加 入 进来 ,只 需要 把 已 加 入 其 中 ,其 他 
几 个 属性 已 经 存在 于 闭 包 中 。 

Xt :=ABCEGP 

由 于 第 三 步 迭 代 和 第 二 步 迭 代 结果 不 相同 ,因此 进入 第 四 步 迭 代 。 

第 四 步 迭 代 : PC-~A,PAB-~CG 这 些 函 数 依赖 的 右边 属性 可 以 加 入 进来 ,但 是 属性 A 
及 G 已 经 在 闭 包 中 ,因此 不 需要 发 生 改变 ,第 四 步 迭 代 的 结果 与 第 三 步 迭 代 的 结果 相同 。 
至 此 ,迭代 结束 。 

结果 为 : ABCEGP。 

【 例 8.6】 已 知 关系 模式 RCU,F), 其 中 U={ 学 号 ,姓名 ,性 别 ,所 在 系 , 系 主任 ,课程 
编号 ,课程 名 ,成 绩 } , 设 下 = { 学 号 一 姓名 ,学 号 一 性 别 , 学 号 一 所 在 系 , 所 在 系 一 系 主任 ， 
课程 号 一 课程 名 ,{ 学 号 ,课程 号 } 一 成 绩 } ,计算 {学 号 ,课程 号 }+ 。 
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初始 值 为 X :一 { 学 号 ,课程 号 } 。 

第 一 步 迭 代 : 在 下 中 找 出 左边 是 { 学 号 ,课程 号 } 子 集 的 函数 依赖 ,有 学 号 一 姓名 ,学 
号 一 性 别 ,学 号 一 所 在 系 ,{ 学 号 ,课程 号 }~ 成 绩 。 

X# :二 {学 号 ,课程 号 ;U {姓名 ,性 别 ,所 在 系 ,成 绩 } = { 学 号 ,课程 号 ,姓名 ,性 别 ,所 
在 系 ,成 绩 }。 由 于 初始 值 和 第 一 次 迭代 结果 不 相同 ,因此 进入 第 二 次 迭代 。 

第 二 步 迭 代 : 在 下 中 找 出 左边 是 {学 号 ,课程 号 ,姓名 ,性 别 ,所 在 系 ,成 绩 } 子 集 的 函 
数 依赖 ,只 有 所 在 系 习 系 主任 。 

XE :二 {学 号 ,课程 号 ,姓名 ,性 别 ,所 在 系 ,成 绩 } U { 系 主任 } 二 {学 号 ,课程 号 ,姓名 ， 
性 别 , 所 在 系 , 成 绩 , 系 主任 } 。 

由 于 已 经 包含 全 部 属性 ,所 以 迭代 结束 。 

结果 为 {学 号 ,课程 号 )* 二 {学 号 ,课程 号 ,姓名 ,性 别 ,所 在 系 ,成 绩 , 系 主任 }。 


6. 最 小 覆盖 


定义 8.16 若 函 数 依赖 集 F 满足 下 列 条 件 , 则 称 下 为 极 小 (函数 ) 依 赖 集 , 亦 称 最 小 
(函数 ) 依 赖 集 、 最 小 覆盖 。 

(1) 下 的 每 个 函数 依赖 的 右 部 仅 含有 一 个 属性 。 

(2) 对 下 中 的 任 一 个 函数 依赖 X 一 A, 都 有 下 与 F -(X 一 A}) 不 等 价 。 

(3) 对 下 中 的 任 一 个 函数 依赖 X 一 A, 都 有 FF 与 (F -{(X 一 A))U {2Z 一 A}) 不 等 价 ， 

其 中 Z 是 X 的 任 一 真子 集 。 

求 函 数 依赖 的 最 小 覆盖 算法 如 下 。 

(1) 对 于 下 中 每 个 函数 依赖 ,如 果 其 右边 属性 不 是 单一 属性 , 则 全 部 分 解 为 单一 
属性 。 

(2) 去 掉 所 有 宛 余 的 函数 依赖 , 即 对 于 下 中 的 某 一 个 函数 依赖 X 一 了 ,如 果 可 以 由 下 
中 剩 下 的 函数 依赖 推导 出 来 , 则 可 以 去 掉 XY。 

(3) 去 掉 每 个 函数 依赖 中 左边 决定 属性 中 多 余 的 属性 。 对 于 下 中 的 函数 依赖 X 一 
Y, 如 果 X 由 两 个 或 者 多 个 属性 构成 , 则 需要 考虑 这 些 属性 是 否 多余 ; 假 定 A 是 X 的 真子 
集 , 即 判 断 是 否 存在 函数 依赖 A 一 Y。 如 果 存 在 , 则 用 A>Y 代替 X-~~Y。 

【 例 8.7】 求 下 列 函 数 依赖 集 下 的 极 小 依赖 集 。 

F={AB—>C,D>EG,C—>A,BE—>C,BC—>D,CG—>BD,ACD—B,CE—>AG} 

第 一 步 , 将 下 中 的 函数 依赖 的 右 部 分 解 为 单 属性 ,得 到 

G={AB—C,D—>E,D—>G,C—>A,BE—>C,BC—>D,CG—B,CG—>D,ACD—B,CE— 
A,CE—G }。 

第 二 步 ,去 掉 G 中 多 余 的 函数 依赖 。 

(1) 判断 AB 一 C 是 否 为 多 余 的 函数 依赖 。 

先 去 掉 G 中 的 AB 一 C, 得 到 Gl= {DE,D 一 G,C 一 A, BE 一 C,BC 一 D,CG 一 B， 
CG—>D,ACD—B,CE>A,CE—>G )}。 

因为 {AB}a1 二 {A,B),C 不 属于 {AB}at ,所 以 不 多 余 。 

(2) 判断 D>E 是 否 为 多 余 的 函数 依赖 。 
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先 去 掉 G 中 的 D 一 下 ,得 到 GC2=(AB-~C，D-GC,C 一 A,BE-~C,BC-~D,CG-B,CG 
>D,ACD—>B,CE—>A,CE—~>G}. 

因为 {D}je+ 一 {D,G}), 忆 不 属于 (Dje+ ,所 以 不 多 余 。 

(3) 判断 CE-~~A 是 否 为 多 余 的 函数 依赖 。 

先 去 掉 G 中 的 CE 一 A, 得 到 G4={AB 一 C,D>E,D 一 G,C 一 A,BE 一 C, BC 一 D， 
CG—>B,CG—>D,ACD—>B,CE—G}. 

因为 {CE}a1+ 二 {A,C,E,G,D,B),A 属于 {CE}e+ ,所 以 多 余 。 自 己 分 析 剩 下 的 函 
数 依赖 是 否 多 余 。 

发 现 G 中 多 余 的 函数 依赖 CE 一 A,CG 一 B, 去 掉 这 些 多 余 的 函数 依赖 ,得 到 H= {AB 一 
C,D>E,D—>G,C—™>A,BE—>C,BC—>D, CG>D,ACD—>B, CE—G}. 

第 三 步 , 找 出 函数 依赖 的 左边 有 多 余 属性 的 函数 依赖 。 

函数 依赖 ACD~>B, 因 为 {CD}a+={C,D,E,G,A,B}, 所 以 CD~~B, 因 此 A 是 多 余 
的 。 同 理 ,可 以 验证 其 他 函数 依赖 的 左边 都 不 存在 多 余 属 性 。 

把 五 中 的 ACD 一 B 换 成 CD 一 B, 得 到 F,=={ABC,D>E,D 了 YG,C>A,BEC， 
BC—D, CG—>D,CD—B, CE—G}. 


7. 函数 依赖 集 的 等 价 与 覆盖 


定义 8.17 设 忆 和 G 都 是 关系 模式 R 上 的 两 个 函数 依赖 集 , 如 果 F+ 二 G+ , 则 称 下 
与 G 等 价 (或 称 下 覆盖 G ,或 G 覆盖 下 )。 

定理 8.1 每 个 函数 依赖 集 下 均等 价 于 一 个 极 小 函数 依赖 集 F。。 此 FF 称 为 下 的 
最 小 依赖 集 。 

两 个 关系 模式 R<U,F> .Ri<U,G>> ,如 果 下 与 G 等 价 ,那么 Ri 的 关系 一 定 是 R。 
的 关系 ; 反 过 来 ,R, 一 定 是 Ri 的 关系 。 


8.5 关系 模式 分 解 


把 一 个 低 一 级 的 关系 模式 分 解 为 若干 个 高 一 级 的 关系 模式 的 方法 不 唯一 。 

定义 8.18 关系 模式 分 解 的 定义 , 设 有 关系 模式 R<U,F 二 的 一 个 分 解 是 指 p= 
{Ri1<U ,Fi>,R,<U;,F>,…,R,<U,,F,>}, 其 中 U =U Ui, 并 且 没 有 USU， 
1<i,j 二 n,F; 是 下 在 U; 上 的 投影 。 函 数 依赖 集合 {X->Y| X 一 YE F+ 人 AXYSU;) 的 一 个 

盖 F; 叫 作 下 在 属性 U; 上 的 投影 。 

例如 ,对 于 关系 模式 SL(sno,sdept,sloc) ,可 以 有 多 种 分 解 方 法 ,具体 如 下 。 

方法 一 : SN(sno) ,SD(sdept) ,SO(sloc) 

方法 二 : NL(sno,sloc) ,DL(sdept,sloc) 

方法 三 : ND(sno,sdept) ,NL(sno,sloc) 

方法 四 : ND(sno,sdept) ,DL(sdept, sloc) 

以 上 4 种 分 解 方法 , 哪 种 方法 最 合理 ? 
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1. 模式 分 解 的 等 价 性 


模式 分 解 是 将 模式 分 解 为 一 组 等 价 的 子 模式 的 过 程 。 等 价 是 指 不 破坏 原 有 关系 模式 
的 数据 信息 , 既 可 以 通过 自然 连接 恢复 为 原 有 关系 模式 ,又 可 以 保持 原 有 函数 依赖 集 。 

要 保证 分 解 后 的 关系 模式 与 原 关系 模式 等 价 ,有 以 下 3 种 标准 。 

(1) 分 解 具有 无 损 连 接 性 。 

(2) 分 解 要 保持 函数 依赖 。 

(3) 分 解 既 要 保持 函数 依赖 ,又 要 保持 无 损 连 接 性 。 

定义 8.19 ”分解 具有 无 损 连 接 性 的 定义 , 设 关系 模式 RU,E) 被 分 解 为 若干 个 关系 模 
式 RD, 记 ) ,Rs (D2,Fi),…,R,(U,,F,),( 其 中 U=UUU;U-…UU,, 且 不 存在 U; 包含 于 
UU; 中 ,Ri 为 下 在 U; 上 的 投影 ), 若 尺 与 Ri,R,,…,R, 自然 连接 的 结果 相等 , 则 称 关系 模式 
RR 的 分 解 具 有 无 损 连接 性 。 只 有 具有 无 损 连接 性 的 分 解 ,才能 保证 不 丢失 信息 。 

定义 8.20 保持 函数 依赖 的 定义 , 设 关 系 模式 R(U ,下 ) 被 分 解 为 若干 个 关系 模式 
RU ,FiD ,Rs (Us ,Fo),…,R,(U,,F,),( 其 中 U=UiUUsU…UU,, 且 不 存在 U; 包含 
于 UU; 中 ,Ri 为 F 在 U; 上 的 投影 ) , 若 正 逮 辑 蕴涵 的 函数 依赖 一 定 由 分 解 的 某 个 关系 模式 
的 函数 依赖 F; 所 多 辑 萄 涵 , 则 称 关系 模 式 R 的 分 解 保持 函数 依赖 。 


2. 无 损 分 解 的 测试 算法 


算法 8.1 无 损 连 接 性 判定 算法 。 

输入 : R<U，F> 的 一 个 分 解 p= {Ri(Ui ,Fi),…, Ri(Ui ,Fi)}， 

U={Ai,A:,…,A,)}, 

下 二 {FD1 ,FD: ,… ,FD,)}), 可 设 下 为 最 小 覆盖 ,FD;: X; 一 Aj。 

输出 : p 是否 为 无 损 连 接 的 判定 结果 。 

第 一 步 : 构造 一 个 k 行 n 列 的 表 , 第 i 行 对 应 关系 模式 R;, 第 j 列 对 应 属性 Aj; 若 
A; EU;, 则 在 第 i 行 第 j 列 处 写 信 aj; 否则 写 入 ajo。 

第 二 步 : 逐个 检查 下 中 的 每 个 函数 依赖 ,并 修改 表 中 的 元 素 。 

对 每 个 FD;: X; 一 A; ,在 Xi 对 应 的 列 中 寻找 值 相同 的 行 ,并 将 这 些 行 中 A; (j 为 列 
号 ) 对 应 的 列 值 全 改 为 相同 的 值 。 修 改 规则 为 : 若 其 中 有 aj , 则 全 改 为 aj ;否则 不 改 。 

第 三 步 : 判别 : 若 某 一 行 变 成 wm ,as,… ,a , 则 算法 终止 (此 时 o 为 无 损 分 解 ); 否 则 ,比较 本 
次 扫描 前 后 的 表 有 无 变化 , 若 有 , 则 重复 第 二 步 ; 若 无 , 算 法 终止 (此 时 p 不 是 无 损 分 解 )。 

【 例 8.8】 设 模式 为 R<U, F>,U=(A, B,C, D, E},F =(AB 一 C，C 一 了 ， 
D 一 EE) ,分 解 为 Ri(A, B,C) 、R;(C, D)、R;(D, E)。 求 此 分 解 是 否 为 无 损 连接 分 解 ? 

第 一 步 : 








A B C D E 
Ri QI Q2 as a Qs 
R; a az2 as as Qs 




















R; aal Qa 33 Q4 as 
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第 二 步 : 存在 函数 依赖 CD ,根据 规则 修改 D 列 的 值 , 修 改 后 的 结果 如 下 表 。 











A B C D E 
Ri a az as as al5 
R; Qal lz as as 25 
Rs aa Qa aa as as 
































A B C D E 
R, a a as a as 
R, aa 22 as as as 
Ra aal Qs2 aa3 as as 





第 四 步 : 存在 函数 依赖 AB 一 C, 根 据 规则 修改 C 列 的 值 ,不 需要 做 任何 修改 。 在 上 
表 中 ,第 一 行 的 值 变 为 a1 ,as ,as ,as was ,因此 该 分 解 为 保持 无 损 连接 分 解 。 


3. 函数 依赖 分 解 的 算法 


定义 8.21 车 Ft 二 ( F,)+, 则 R 二 U, 下 > 的 一 个 分 解 p 一 (RU ,Ri)，，…， 


Ri (Ui ,Fi)) 保持 函数 依赖 。 

算法 8.2 ”函数 依赖 的 分 解 算法 。 

输入 : 关系 尺 和 关系 RR1 二 ITL(R),L 是 关系 R 的 属性 组 。 

输出 : 关系 Rl 上 最 小 的 函数 依赖 集 。 

算法 如 下 。 

第 一 步 : 设 工 是 关系 R, 上 的 函数 依赖 集 ,T 的 初始 值 为 空 。 

第 二 步 : 计算 X+ ,其 中 六 是 R, 的 子 集 。 

第 三 步 ; 建立 XA 加 入 到 函数 依赖 集 T 中 ,其 中 A 既是 在 X+ 中 的 属性 , 且 又 是 关 
系 Ri 中 的 属性 。 

第 四 步 ; 计算 函数 依赖 集 T 的 最 小 函数 依赖 集 。 

【 例 8.9】 关系 R(A,B,C,D) ,函数 依赖 集 为 A 一 B,B 一 C,C 习 DD, 求 关 系 Ri(A， 
C,D) 上 的 函数 依赖 集 T。 

第 一 步 : 设 T 为 空 。 

第 二 步 : 

A}+ 二 {A,B,C,D}, 去 掉 其 中 的 B, 因 为 不 在 关系 R 中 ,因此 T: AC,A 一 D。 


{A} 

{C}*+ = 二 {C,D}), 因 此 对 函数 依赖 集 T 增 加 CD。 
{D}+={D}。 

{C,D}+={C,D}。 


因此 函数 依赖 集 T: A 一 C,A 一 D, C>D。 其 最 小 函数 依赖 集 为 A 一 C,C>D。 
这 里 由 于 属性 {A)* = 二 {A,B,C,D} ,因此 任何 A 的 超 集 的 闭 包 都 不 需要 再 计算 。 只 
需 计算 {C,D}1 ,再 对 函数 依赖 进行 最 小 化 处 理 。 
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例如 ,对 关系 模式 SL(sno,sdept,sloc) 进 行 分 解 。 

方法 一 : SN(sno) ,SD(sdept) ,SO(sloc)。 

丢失 了 很 多 有 用 的 信息 ,分 解 不 能 保持 函数 依赖 ,不 具有 无 损 连 接 性 。 
方法 二 : NL(sno,sloc) ,DL(sdept,sloc)。 

分 解 能 保持 函数 依赖 ,但 不 具有 无 损 连接 性 。 

方法 三 : ND(sno,sdept) ,NLCsnoysloc) 。 

分 解 具有 无 损 连 接 性 ,但 不 能 保持 函数 依赖 。 

方法 四 : ND(sno,sdept) ,DL(sdept, sloc)。 

分 解 既 能 保持 函数 依赖 ,又 具有 无 损 连接 性 。 


“8.6 模式 分 解 算法 


下 面 是 关于 模式 分 解 的 几 点 重要 内 容 。 

(1) 若 要 求 分 解 保持 函数 依赖 ,那么 模式 分 离 中 可 以 达到 3NF, 但 是 不 一 定 能 达到 
BCNF。 

(2) 若 要 求 分 解 既 保持 函数 依赖 ,又 具有 无 损 连 接 性 , 则 可 以 达到 3NF, 但 是 不 一 定 
能 达到 BCNF 。 

(3) 若 要求 分 解 具有 无 损 连 接 性 , 则 可 达到 4NF。 

算法 8.3 ”把 一 个 关系 模式 分 解 为 3NF , 且 使 它 保持 函数 依赖 。 

输入 : 关系 模式 R<U, F>。 

输出 : R 的 一 个 分 解 p 二 {Ri ,Rs，…: ,Ri) ,每 个 Ri 均 为 3NF, 且 p 保 持 函 数 依 赖 。 

(1) 极 小 化 : 对 下 进行 极 小 化 处 理 (处 理 后 的 函数 依赖 集 记 为 G) 。 

(2) 最 小 函数 依赖 集 G 中 左边 决定 属性 相同 的 为 一 组 ,每 一 组 形成 新 的 关系 R;( 其 
中 i 为 1,2,3,…,k 一 1)。 

(3) 出 现在 属性 集 U 中 而 没有 出 现在 G 中 的 属性 组 成 一 个 关系 模式 R, 。 

【 例 8.10】 设 关系 模式 R(A.B.,C,G,H,R,S,7T)， 

F={C—>T,CS—>G, HT—R,HR—C, HS—R)} 

求 : (1) R 的 一 个 候选 关键 字 。(2) 将 RR 分 解 为 3NF, 并 且 保 持 函 数 依赖 性 。 

答 : (1) R 的 一 个 候选 关键 字 为 ABCSH 。 

(2) 求 最 小 函数 依赖 集 G 就 是 下 。 

得 到 一 个 分 解 为 Ri (CT) ,R:(CSG) ,RCHTR) ,RCHRC) ,RCHSR) ,ReCAB) 。 

算法 8.4 转换 为 3NF 既 保持 函数 依赖 ,又 具有 无 损 连 接 性 的 分 解 算 法 在 算法 8. 3 
分 解 的 基础 上 ,增加 一 个 模式 ,该 模式 以 原 模 式 的 一 个 关键 字 作为 属性 组 ,使 该 模式 起 到 
正确 连接 其 他 各 模式 的 作用 。 

算法 思想 如 下 。 

(1) 用 算法 8.3 将 尺 分 解 为 p=={ Ri(U1), Rz (U2),… ,Ri(U)})。 

(2) 求 尺 的 一 个 关键 字 X 。 

(3) 若 X 是 某 个 U; 的 子 集 , 则 输出 分 解 * 一 o; 否则 , 输出 r==pU 1{ R(X)) ;算法 结束 。 
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【 例 8. 11〗 关系 R(A,B,C,D), 其 最 小 依赖 集 F 二 {A 一 B,C 习 D} , 按 算法 8. 3 得 到 


的 分 解 是 p, 一 {AB,CD}), pi 不 具有 无 损 连 接 性 。R 的 关键 字 是 AC ,分 解 成 p 二 {AB， 
CD,AC} 既 保持 函数 依赖 ,又 具有 无 损 连接 性 。 


R= 


算法 8.5 分 解 为 BCNF, 且 具有 无 损 连接 。 

输入 : 关系 模式 RCU,F)。 

输出 : 关系 R 分 解 为 一 组 BCNF, 且 具有 无 损 连接 。 

算法 如 下 。 

第 一 步 ; 判断 R 是 否 为 BCNF, 如 果 是 ,算法 结束 ,否则 执行 第 二 步 。 

第 二 步 : 对 于 某 个 关系 模式 Ro ,假设 存在 违反 BCNF 的 函数 依赖 X 一 了, 计算 X+ ， 
X+ 构 成 一 个 关系 模式 ,R, 由 属性 X 及 那些 不 在 X+ 中 而 在 Ru 中 的 属性 构成 。 

第 三 步 : 分 别 计算 R, 及 R。 上 的 函数 依赖 集 。 

第 四 步 : 重复 执行 第 二 步 及 第 三 步 ,直到 所 有 的 关系 模式 为 BCNF 。 

算法 8.6 分 解 为 4NF, 且 具有 无 损 连 接 性 。 

输入 : 关系 模式 R(U,F)。 

输出 : 分 解 为 一 组 4NF, 并 且 保 持 无 损 连 接 。 

算法 如 下 。 

第 一 步 ; 判断 R 是 否 为 4NF, 如 果 是 ,算法 结束 ,否则 执行 第 二 步 。 

第 二 步 ; 对 于 某 个 关系 模式 Ro ,假设 存在 违反 4NF 的 非 平凡 多 值 函 数 依赖 X 一 一 


Y, 把 R。 分 解 为 Ri 三 Ro。 一 Y(R。 去 掉 属 性 组 Y) 和 Rs 为 X 和 Y 的 并 集 。 


第 三 步 : 分 别 计算 R, 及 R, 上 的 函数 依赖 集 。 
重复 执行 第 二 步 及 第 三 步 ,直到 所 有 的 关系 模式 为 4NF。 





8.7 规范 化 应 用 


假设 某 建筑 公司 设计 了 一 个 数据 库 , 其 中 包含 如 下 业务 规则 。 
公司 承担 多 个 工程 项 目 , 每 一 项 工程 有 工程 号 .工程 名 称 . 施 工人 员 等 ;公司 有 多 名 职 


工 ,每 名 职工 有 职工 号 、 姓 名 、 职 务 ( 工 程 师 、 技 术 员 ) 等 ;公司 按照 员工 参与 项 目的 工时 和 
小 时 工资 率 支付 工资 ,小 时 工资 率 由 职工 的 职务 决定 (例如 ,技术 员 的 小 时 工资 率 与 工程 
师 的 小 时 工资 率 不 同 ) 。 


根据 以 上 要 求 ,公司 定 期 制定 一 个 工资 报表 Salary, 如 表 8. 27 所 示 。 该 工资 报表 包 


含 很 多 元 余 , 并 可 能 导致 各 种 异常 。 现 在 要 求 将 该 工资 报表 规范 化 到 3NF。 


表 8.27 Salary 表 一 


工程 号 工程 名 称 | 职工 号 姓名 职务 小 时 工资 率 工时 “| 实 发 工资 





1001 齐 光 明 工程 师 65 13 845 
Al 花园 大 厦 1002 李 思 奇 | 技术 员 60 16 960 
1004 葛 宇 红 律师 60 19 1140 
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续 表 
工程 号 工程 名 称 | 职工 号 姓名 职务 小 时 工资 率 工时 “| 实 发 工资 

1001 齐 光 明 | 工程 师 65 15 975 
A2 立交 桥 

1003 鞠 明 亮 下 类 55 17 935 

1002 李 思 奇 | 技术 员 60 18 1080 
A3 临 江 饭 店 

1004 葛 宇 红 律师 60 14 840 























通过 分 析 , 存 在 以 下 函数 依赖 。 
工程 号 一 工程 名 称 
职工 号 一 姓名 ,职务 ,小 时 工资 率 , 实 发 工资 
工程 号 ,职工 号 一 工时 
职务 一 小 时 工资 率 
因此 ,Salary 表 的 码 为 “职工 号 十 工程 号 ”, 主 属性 为 职工 号 和 工程 号 。 
第 一 种 方法 : 根据 范式 的 定义 ,采用 非 形式 化 的 方法 结合 经 验 对 该 关系 进行 分 解 。 
第 一 步 ; 判断 该 工资 表 是 否 属于 1NF,1NF 要 求 不 能 出 现 表 中 有 表 。 对 该 关系 规范 
化 到 1NF, 如 表 8. 28 所 示 。 





表 8.28 Salary 表 二 


工程 号 工程 名 称 | 职工 号 姓名 职务 小 时 工资 率 工时 | 实 发 工资 
Al 花园 大 厦 工程 师 845 
Al 花园 大 厦 技术 员 960 
Al 花园 大 厦 律师 1140 


















A2 立交 桥 工程 师 975 
A2 立交 桥 mh 935 
技术 员 1080 






律师 840 








第 二 步 : 判断 该 工资 表 是 否 为 2NF。 

由 于 存在 非 主 属性 对 码 的 部 分 依赖 ,因此 不 为 ZNF。 把 违反 2NF 的 函数 依赖 单独 组 
合成 一 个 关系 ,分 解 为 

S1( 工 程 号 ,职工 号 ,工时 ) 

S2( 工 程 号 ,工程 名 称 ) 

S3( 职 工 号 ,姓名 ,职务 ,小 时 工资 率 , 实 发 工资 ) 

经 过 分 析 ,S1、S2、S3 均 为 2NF。 

第 三 步 : 判断 S1、S2、S3 是 否 为 3NF。 

其 中 Sl1 和 S2 为 3NF ,不 存在 非 主 属性 对 码 的 传递 依赖 。 在 S3 中 存在 职工 号 一 职 
务 ,职务 一 小 时 工资 率 ,因此 S3 不 为 3NF。 

第 四 步 : 分 解 S3 ,把 违反 3NF 的 传递 依赖 单独 组 合成 一 个 关系 ,因此 S3 分 解 为 

S31( 职 工 号 ,姓名 ,职务 , 实 发 工资 ) 
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S32( 职 务 ,小 时 工资 率 ) 

Salary 表 最 终 分 解 为 

S1( 工 程 号 ,职工 号 ,工时 ) 

S2( 工 程 号 ,工程 名 称 ) 

S31( 职 工 号 ,姓名 ,职务 , 实 发 工资 ) 

S32( 职 务 , 小 时 工资 率 ) 

第 二 种 方法 : 采用 算法 8.4 分 解 。 

第 一 步 : 找 出 Salary 表 的 码 。 

Salary 表 的 码 为 “职工 号 十 工程 号 ”。 

第 二 步 : 求 该 工资 表 的 最 小 函数 依赖 集 。 

工程 号 一 工程 名 称 

职工 号 一 姓名 

职工 号 一 职务 

职工 号 一 小 时 工资 率 

职工 号 一 实 发 工资 

工程 号 ,职工 号 一 工时 

职务 一 小 时 工资 率 

第 三 步 : 决定 属性 相同 的 为 一 组 形成 一 个 新 的 关系 ,因此 有 : 

“工程 号 二 工程 名 称 ” 构 成 S1( 工 程 号 ,工程 名 称 ) 。 

“职工 号 一 姓名 ,职务 ,小 时 工资 率 , 实 发 工资 "构成 S2( 职 工 号 ,姓名 ,职务 ,小 时 工资 
率 , 实 发 工资 ) 。 

“工程 号 ,职工 号 一 工时 ”构成 S3( 工 程 号 ,职工 号 ,工时 ) 。 

“职务 一 小 时 工资 率 ? 构 成 S4( 职 务 ,小 时 工资 率 ) 。 


8.8 小 结 


本 章 首先 通过 关系 模式 存在 的 异常 问题 引出 数据 依赖 的 概念 。 数 据 依赖 包括 函数 依 
赖 、. 多 值 依赖 .连接 依赖 。 然 后 介绍 了 1NF、2NF、3NF、BCNF、4NF、5NF 及 其 相关 概念 ， 
引入 数据 依赖 的 公理 系统 。 关 系 模式 的 规范 化 理论 是 解决 异常 问题 的 途径 。 关 系 模 式 规 
范 化 级 别 越 高 ,其 存在 的 异常 问题 越 少 ,同时 也 指出 并 不 是 规范 化 程度 越 高 ,模式 越 好 。 
之 后 讨论 了 关系 模式 分 解 理论 ,主要 是 通过 投影 运算 将 一 个 低 一 级 规范 化 程度 的 关系 模 
式 分 解 为 一 组 高 一 级 规范 化 程度 的 关系 模式 ,分 解 后 的 关系 模式 通过 自然 连接 与 分 解 之 
前 的 关系 模式 等 价 。 最 后 介绍 了 模式 分 解 的 算法 。 


8.9 习题 


1. 给 定 关系 模式 R(A,B,C,D,E,F), 其 函数 依赖 集合 下 包含 以 下 函数 依赖 AB 一 
C,BC>AD,DE,CF>B。 求 {A,B}+。 
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2. 给 定 关系 模式 RCA,B,.C,D,E,F), 其 函数 依赖 集合 下 包含 以 下 函数 依赖 AB 一 
C,BC-~AD,D-~~E,CF-~B, 求 AB-~~D 是 否 为 函数 依赖 集 F 所 蕴涵 ,D 一 A 又 是 否 为 函 
数 依赖 集 F 所 蕴涵 ? 

3. 给 定 关系 模式 RCA,B,C) ,存在 函数 依赖 A 一 BC, BAC, CAB, 求 此 函数 依 
赖 集 的 最 小 覆盖 。 

4. 给 定 关系 模式 R(A,B,C,D) ,存在 函数 依赖 A 一 B,B 一 C,C>DD ,假设 分 解 出 一 个 
关系 模式 R(A,C,D), 求 此 关系 模式 Ri 上 存在 的 函数 依赖 。 

5. (1) 给 定 关系 模式 R(A,B,C,D) 及 其 函数 依赖 集 AB 一 C, CD, D 一 A, 求 此 关 
系 模式 所 有 的 码 。 

(2) 给 定 关系 模式 S(A,B,C,D) 及 其 函数 依赖 集 A 一 B, B 一 C,，B 一 DD, 求 此 关系 模 
式 所 有 的 码 。 

(3) 给 定 关系 模式 T(A,B,C,D) 及 其 函数 依赖 集 AB 一 C, BC 一 D, CDA, AD 一 
B, 求 此 关系 模式 所 有 的 码 。 

(4) 给 定 关系 模式 U(A,B,C,D) 及 其 函数 依赖 集 A 一 B, BC, C>D, D 习 A, 求 此 
关系 模式 所 有 的 码 。 

6. 给 定 关系 模式 R(A,B,C,D) 及 函数 依赖 集 A 一 B,B 一 C,CD 一 A, 关 系 模式 RR 分 
解 为 Si 二 {A,D},S, 二 {A,C}),S; 二 {B,C,D} ,关系 模式 R 的 初始 表格 如 下 所 示 。 此 分 解 
保持 无 损 连接 吗 ? 











A B C 

a b a d 
a bo» c d; 
as b c d 


7. 给 定 关系 R(A,B,C,D) 及 函数 依赖 集 B 一 AD, 分 解 为 关系 Ri{A,B),R,{B,C} 
和 Rs{C,D} ,关系 模式 R 的 初始 化 数据 如 下 所 示 ,此 分 解 保持 无 损 连接 吗 ? 














A B Cc D 
a b a di 
a2 b dz 
as bs 2 d 


8. 给 定 关系 R(A,B,C,D,E) 及 函数 依赖 集 AB 一 C, CB, A 一 D, 把 此 关系 模式 分 
解 为 3NF ,并 保持 函数 依赖 及 无 损 连 接 。 

9. 判断 FF={A 一 C,AC>D,E 一 AD,E 一 HH) 与 G={ACD,E 一 AH) 两 个 函数 依赖 
集 是 否 等 价 。 

10. 设 有 函数 依赖 集 F={B 一 C,CA,CB,A 一 B.A 一 C,BC 一 A), 求 与 下 等 价 的 
最 小 函数 依赖 集 。 

11. 给 定 关 系 模式 R={A,B,C,D,E} 及 函数 依赖 集 A 一 BC,CD 习 E,B 一 D,EA， 
把 此 关系 模式 R 分 解 为 既 保持 无 损 连 接 , 又 保持 函数 依赖 的 3NF, 并 判断 分 解 模式 
Ri1{A,B,C},R;{A,D,E}) 是 否 保持 无 损 连 接 。 
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结构 化 查询 语言 (Structured Query Language,SQL) 是 当前 关系 数据 库 的 标准 操作 
语言 ,也 是 一 个 通用 的 、 功 能 极其 强大 的 关系 数据 库 语 言 。 其 功能 包含 数据 库 模 式 的 定 
义 ,数据 库 数据 的 增 \ 删 ` 改 , 查 , 以 及 数据 库 安 全 性 、 完 整 性 的 定义 与 维护 等 功能 。 


9.1 SQL 概述 


1. SQL 介绍 


1974 年 ,SQL 由 Boyce 和 Chamberlin 提出 ,并 于 1979 年 在 IBM 公司 的 RDBMS 原 
型 System R 上 实现 了 该 语言 ,此 后 ,主要 由 一 些 非 营利 性 机 构 (ISO、ANSI) 组 织 编写 了 
SQL 标准 ,其 版 本 有 SQL-86 (SQL1)、SQL-89、SQL-92 (SQL2)、SQL-99(SQL3),、SQL 
2003、 SQL 2008、SQL 2011 ,其 中 的 数字 为 发 布 标准 的 年 份 ,如 表 9. 1 所 示 。 每 一 版 本 的 
内 容 都 在 上 一 版 的 基础 上 进行 扩展 。SQL-99 在 SQL-92 的 版 本 上 进行 修订 完善 ,并 扩充 
了 新 的 功能 ,如 增加 了 对 象 的 概念 ,支持 大 数据 类 型 的 存储 。SQL-99 包含 一 个 核心 规范 
及 一 些 可 选 的 标准 ,所 有 的 RDBMS 都 支持 核心 规范 ,可 选 标准 包含 数据 挖掘 .空间 数据 
库 、. 时 序数 据 库 、 多 媒体 数据 库 、 在 线 分 析 处 理 、 数 据 仓 库 等 应 用 。SQL 2003 在 SQL-99 
的 基础 上 扩充 了 新 的 数据 类 型 和 新 的 函数 等 。 本 教材 主要 讲述 SQL-99 的 用 法 。 


表 9.1 SQL 标准 发 展 历史 





标 准 大 致 页 数 发 布 日 期 标 准 大 致 页 数 发 布 日 期 
SQL-86(SQL1) 1986 年 10 月 SQL 2003 3600 2003 年 
SQL-89 120 1989 年 SQL 2008 3777 2008 年 
SQL-92(SQL2) 622 1992 年 SQL 2011 2011 年 


SQL-99(SQL3) 1700 1999 年 





自从 SQL 成 为 标准 后 ,应 用 非常 广泛 ,市 场 上 大 部 分 的 关系 型 数据 库 管理 系统 都 支 
持 SQL。 不仅 著名 的 大 型 商用 数据 库 产品 (如 Oracle、DB2、Sybase、SQL Server) 支持 
SQL, 很 多 开源 的 数据 库 产品 (如 PostgreSQL、MySQL) 也 支持 它 , 甚 至 一 些小 型 的 产品 
(如 Access) 也 支持 SQL。 近 几 年 ,着 勃发 展 的 NoSQL 系统 最 初 宣称 不 再 需要 SQL ,后 
来 也 不 得 不 修正 为 Not Only SQL ,与 SQL 衔接 。 

目前 ,虽然 各 个 数据 库 厂商 都 分 别 推出 了 支持 SQL 标准 的 产品 ,但 是 没有 一 个 数据 
库 系统 能 支持 SQL 标准 中 的 所 有 概念 ,大 部 分 数据 库 系 统 能 支持 SQL-92 中 的 大 部 分 功 
能 及 SQL-99、SQL 2003 的 部 分 新 概念 。 而 且 为 了 提高 竞争 力 , 还 在 不 同 程度 上 对 SQL 
标准 进行 了 扩充 和 修改 ,支持 标准 以 外 的 一 些 内 容 , 因 此 ,现在 的 RDBMS 的 SQL 风格 各 
不 相同 。 也 就 是 说 ,标准 SQL 与 实际 数据 库 产品 中 的 SQL 并 不 完全 一 致 。 本 书 不 介绍 
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完整 的 SQL 标准 ,只 介绍 基本 概念 和 基本 功能 ,因此 在 使 用 时 请 查阅 各 标准 及 各 产品 
手册 。 

由 于 SQL 成 为 关系 数据 库 标 准 语言 , 当 数据 库 应 用 系统 中 需要 改变 所 使 用 的 
RDBMS 时 ,不 需要 花费 太 多 的 精力 ,因为 这 些 RDBMS 都 遵循 同样 的 SQL 标准 。 


2. SQL 对 三 级 模式 结构 的 支持 
SQL 对 关系 数据 库 模 式 的 支持 ,如 图 9. 1 所 示 。 外 模式 对 应 视图 ,模式 对 应 基本 表 ， 

































































内 模式 对 应 存储 文件 。 
有 外 模式 
FE 本 表 模式 
存储 文件 1 存储 文件 2 内 模式 




















9.1 SQL 对 关系 数据 库 模 式 的 支持 


一 个 关系 对 应 一 个 基本 表 , 里 面包 含 实 实在 在 的 数据 ,是 独立 存在 的 。 一 个 或 者 多 个 
表 对 应 保存 在 一 个 存储 文件 中 ,一 个 存储 文件 可 能 包含 多 个 表 ,也 可 能 只 包含 一 个 表 , 一 
个 表 带 若干 索引 ,索引 也 存放 在 存储 文件 中 。 

存储 文件 的 结构 组 成 了 数据 库 的 内 模式 ,其 内 部 结构 对 终端 用 户 是 屏蔽 的 。 

视图 是 从 一 个 或 几 个 基本 表 导 出 的 虚拟 的 表 。 它 本 身 不 独立 存在 于 数据 库 中 ,数据 
库 中 只 存放 视图 的 定义 ,不 存放 数据 ,是 虚拟 的 表 。 


3. SQL 的 内 容 


SQL 主要 关键 字 如 表 9. 2 所 示 , 它 主要 由 数据 定义 语言 (DDL)、 数 据 查询 语言 
(DQL) ,数据 操纵 语言 (DML) 数据 控制 语言 (DCL) 4 部 分 构成 ,涉及 9 个 关键 字 。 


表 9.2 SQL 主要 关键 字 


数据 定义 语言 DDL CREATE .DROP、ALTER 
数据 查询 语言 DQL SELECT 
数据 操纵 语言 DML INSERT`UPDATE DELETE 





数据 控制 语言 DCL GRANT 、REVOKE 
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4. SQL 的 特点 


(1) 集 DDL、DML、DCL、DQL 于 一 体 。SQL 集 DDL、DML、DCL、DQL 于 一 体 , 可 
以 完成 数据 库 生 命 周 期 中 的 全 部 活动 ,包括 建立 数据 库 , 定 义 关系 模式 ,对 数据 及 模式 的 
增 \ 删 \ 改 、 查 ,数据 库 的 维护 、 重 构 ,数据 库 的 安全 性 和 完整 性 控制 ,为 数据 库 应 用 系统 开 
发 提供 了 良好 的 基础 。 

(2) 高 度 非 过 程 化 。SQL 进行 数据 操作 ,用 户 只 需 提出 “做 什么 ”, 而 不 用 说 明 “ 怎 么 
做 ”, 其 操作 过 程 由 系统 自动 完成 。 用 户 无 须 了 解 存 取 路 径 、 存 取 路 径 的 选择 ,操作 过 程 等 
执行 过 程 的 相关 内 容 , 这 样 大 大 减轻 了 用 户 的 负担 。 

(3) 面向 集合 的 操作 方式 。SQL 的 操作 对 象 、. 操 作 结 果 都 是 元 组 的 集合 。 

(4) 一 种 语法 提供 两 种 操作 方式 。SQL 包含 两 种 形式 : 一 种 是 自 含 式 ; 另 一 种 是 嵌 
入 式 。 作 为 自 含 式 语言 , 它 可 以 独立 地 用 于 联机 交互 的 使 用 方式 ,用 户 在 终端 键盘 上 直接 
键入 SQL 命令 对 数据 库 进 行 操作 。 作 为 嵌入 式 语言 ,SQL 嵌入 到 高 级 请 言 程序 中 , 供 程 
序 员 设 计 程 序 时 使 用 ,进行 数据 库 应 用 系统 的 开发 。 在 两 种 使 用 方式 下 ,SQL 语法 结构 
基本 一 致 。 两 种 使 用 方式 采用 同样 的 语法 ,为 用 户 提供 了 极 大 的 方便 。 

(5) 功能 强大 ,语言 简洁 。 完 成 数据 定义 数据 操纵 ,数据 控制 功能 只 需要 9 个 动词 。 


9.2 SQL 定义 


本 节 主 要 包括 关系 模式 的 定义 、 关 系 中 的 数据 类 型 .完整 性 约束 的 定义 、 关 系 模式 的 
修改 ,并 给 出 一 个 具体 的 数据 库 举 例 。 


9.2.1 数据 定义 和 数据 类 型 


1. DDL 


SQL 的 DDL 可 以 定义 表 结 构 、 索 引 、 视 图 、 模 式 等 ,也 可 以 对 这 些 数据 库 对 象 进行 修 
改 和 删除 。 它 主要 包含 表 9. 3 所 示 的 SQL DDL 语句 。 


表 9.3 SQL DDL 语句 





数据 库 对 象 创 建 删 。 除 修 改 
表 CREATE TABLE DROP TABLE ALTER TABLE 
视图 CREATE VIEW DROP VIEW ALTER VIEW 
索引 CREATE INDEX DROP INDEX ALTER INDEX 


在 早期 的 数据 库 系统 中 ,所 有 的 数据 库 对 象 都 属于 一 个 数据 库 , 只 有 一 个 命名 空间 ， 
现代 的 RDBMS 提供 了 一 个 层次 化 的 命名 空间 ,一 个 数据 库 服务 器 (实例 ) 中 可 以 创建 多 
个 数据 库 , 每 个 数据 库 下 面 有 可 能 有 多 个 模式 ,每 个 模式 下 面 通常 包含 多 个 数据 库 对 象 ， 
如 表 、 视 图 索引。 

本 章 以 Microsoft SQL Server 作为 实验 环境 ,所 有 的 语句 都 在 此 环境 下 成 功 运行 ,该 
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实验 环境 不 区 分 大 小 写 。 


(1) 创建 数据 库 , 其 语句 如 下 : 
CREATE DATABASE 数据 库 名 ; 

【 例 9.1】 创建 学 生 数 据 库 。 
CREATE DATABASE student; 


(2) 创建 模式 。 从 SQL2 开始 增加 了 模式 的 概念 。 必 须 有 相应 的 权限 , 才 可 以 创建 


模式 。 


创建 模式 的 语句 如 下 : 
CREATE SCHEMA < 模式 名 >AUTHORIZATION < 用 户 名 >; 


定义 模式 实际 上 是 定义 了 一 个 命名 空间 ,在 这 个 空间 中 包含 表 、 视 图 .索引 等 数据 库 


【 例 9.2】 创建 模式 student_tom。 

CREATE SCHEMA student_tomy 

【 例 9.3】 为 用 户 huang 创建 student_tom 模式 。 
CREATE SCHEMA student tom AUTHORIZATION huang; 


可 以 在 定义 模式 的 同时 定义 表 、 视 图 .索引 等 数据 库 对 象 。 
在 SQL 中 ,删除 模式 的 语句 如 下 : 


DROP SCHEMA < 模式 名 ><CRSCRDE1RESTRICT> ; 


CASCADE 表示 删除 模式 的 同时 删除 模式 中 的 所 有 对 象 ,RESTRICT 表示 如 果 模 式 


中 存在 对 象 , 则 拒绝 删除 该 模式 。 


【 例 9.4】 删除 模式 student_tom。 
DROP SCHEMA student tom CASCADE; 


(3) 创建 表 。 模 式 创建 完毕 后 ,就 可 以 在 其 中 创建 表 了 。 
创建 表 的 语法 格式 如 下 : 
CREATE TABLE < 表 名 > ( 


< 列 名 > < 数据 类 型 > ”[ 列 完整 性 约束 条 件 ] 
[,< 列 名 > < 数据 类 型 > ”[ 列 完整 性 约束 条 件 ]] 


[,< 表 级 完整 性 约束 条 件 ]); 


【 例 9.5】 建立 学 生 表 student。 


CREATE TABLE student 


( 
sno CHAR (5), 
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sname CHAR (20) ， 


ssex CHAR(2), 


sage INT, 


sdept CHAR (30) 


2. 数据 类 型 


不 同 的 RDBMS 环境 下 有 不 同 的 数据 类 型 ,SQL 支持 的 常用 数据 类 型 如 表 9.4 所 示 。 
表 9.4 SQL 支持 的 常用 数据 类 型 






























































数据 类 型 说 明 符 解 释 
大 整 型 BIGINT 整数 值 ,一 般 用 8 个 字 节 存储 
整 型 INT,INTEGER 整数 值 ,一 般 用 4 个 字 节 存储 
小 整 型 SMALLINT 整数 值 ,一 般 用 2 个 字 节 存储 
表示 定点 数 。P 表示 总 的 数字 位 
定点 数 们 型 NS 数 。S 表示 小 数 点 后 的 位 数 
定点 数值 型 NUMERICCP,[S]) 同 decimal 
浮 点 数值 型 REAL 取决 于 机 器 精度 的 浮 点 数 
浮 点 数值 型 DOUBLE 取决 于 机 器 精度 的 双 精 度 浮 点 数 
浮 点 数值 型 FLOAT(n) 浮 点 数 ,一 般 精度 至 少 为 n 位 数字 
CHARCn)， 
定 长 字符 串 让 ER 长 度 为 的 定 长 字符 串 
人 VARCHAR(n) 
n), a 
变 长 字符 串 CHARACTERVARYING (n) | 最 大 长 度 为 ”的 变 长 字符 串 
本 位 串 BIT(n) 表示 长 度 为 n 的 二 进 制 位 串 
变 长 位 串 BIT VARYINGCn) 表示 长 度 为 的 变 长 二 进 制 位 串 
表示 日 期 值 年 ,月 .日 ,表示 为 
日 期 型 DATE ee 
表示 时 间 值 时 、 分 、 秒 , 表示 为 
日 期 时 间 型 “| 时 间 型 HH:MM:SS 
表示 日 期 时 间 值 年 月 .日 .时 、 分 、 
日 期 时 间 型 DATETIME 秒 ,表示 为 YYYY-MM-DD HH， 
MM:SS 
逻辑 型 布尔 值 其 值 为 true 或 者 false, 表示 真 或 
者 假 
字符 型 大 对 象 CLOB 字符 串 大 对 象 
大 对 象 
二 进 制 型 大 对 象 “| BLOB 二 进 制 大 对 象 
由 日 期 ,时间 .6 位 秒 精度 、 时 区 构 
时 间 截 型 TIMESTAMP 成 , 如 ' 2017-08-30 08: 00: 00 
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字符 数据 类 型 的 数据 放 在 单 引 号 里 面 ,区 分 大 小 写 ;按照 字母 表 顺 序 ,如 果 一 个 字符 
串 strl 出 现在 另 一 个 字符 串 str2 前 面 , 则 认为 strl 小 于 str2。 字 符 串 连接 符号 为 “| |”， 
例如 abc'| |'xyz', 其 结果 为 abcxyz'。 

日 期 时间、 时 间 惟 能够 被 转换 成 字符 串 类 型 并 进行 比较 。 


9.2.2 定义 约束 


可 以 在 创建 表 的 同时 ,指定 完整 性 约束 ,也 可 以 在 表 创建 好 后 再 添加 完整 性 约束 。 完 
整 性 约束 被 保存 到 数据 字典 中 。 一 旦 对 数据 库 中 的 数据 进行 操作 ,DBMS 会 自动 根据 定 
义 的 完整 性 约束 检查 数据 是 否 满足 条 件 ,而 采取 相应 的 拒绝 和 接受 操作 。 


1. 主键 约束 


主键 约束 的 关键 字 是 PRIMARY KEY。 
【 例 9.6】 定义 学 生 表 中 的 学 号 为 主键 。 


CREATE TABLE student ( 
sno CHAR(10), 

sname VARCHAR (20) ， 
sage INT, 

sdept CHAR (20), 

sex CHAR(2), 

PRIMARY KEY (sno) 

); 


【 例 9.7】 定义 课程 表 中 的 课程 号 为 主键 。 


CREATE TABLE course( 
Cno INT PRIMARY KEY, 
cname VARCHAR (50), 
credit DECIMAL (2,1), 
cpno INT 

); 


【 例 9.8】 在 选课 表 中 将 学 号 及 课程 号 定义 为 组 合 主键 。 


CREATE TABLE sc( 

sno CHAR(10), 

cno INT, 

grade DECIMAL (3,1), 
PRIMARY KEY (sno, cno) 
) 


定义 主键 约束 时 ,如 果 主 键 由 单一 属性 构成 , 则 可 以 在 属性 定义 后 直接 定义 主键 ,如 
课程 表 , 也 可 以 在 创建 表 语 句 的 末尾 定义 ,如 学 生 表 ; 如 果 主 键 是 组 合 属性 , 则 主键 必须 在 
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所 有 的 属性 定义 完 后 再 进行 定义 ,如 选课 表 。 
定义 主键 约束 时 ,还 可 以 通过 系统 提供 的 CONSTRAINT 关键 字 来 实现 。 
【 例 9.9】 对 课程 表 的 定义 ,还 可 以 有 如 下 两 种 表示 方式 。 


CREATE TABLE course( 

cno INT, 

cname VARCHAR (50), 

credit DECIMAL (2,1), 

cpno INT, 

CONSTRAINT pk_cno PRIMARY KEY (cno) 


CREATE TABLE course( 

cno INT CONSTRAINT pk_cno PRIMARY KEY (cno), 
cname VARCHAR (50), 

credit DECIMAL (2,1), 

cpno INT 

); 


2. 外 键 约束 


外 键 约束 的 关键 字 为 FOREIGN KEY。 
【 例 9.10】 创建 选课 表 , 并 添加 外 键 。 


CREATE TABLE sc( 

sno CHAR(10), 

cno INT, 

grade DECIMAL(3,1), 

PRIMARY KEY (sno, cno), 

FOREIGN KEY (sno) REFERENCES student (sno), 
FOREIGN KEY (cno) REFERENCES course (cno) 
); 


选课 表 中 的 学 号 是 外 键 ,其 值 参考 学 生 表 中 学 号 的 值 ;选课 表 中 的 课程 号 是 外 键 ,其 
值 参考 课程 表 中 课程 号 的 值 。 
【 例 9.11】 创建 课程 表 , 并 给 cpno 添加 外 键 , 它 参考 本 表 中 课程 号 的 值 。 


CREATE TABLE course( 

cno INT PRIMARY KEY, 

cname VARCHAR (50), 

credit DECIMAL (2,1), 

cpno INT, 

FOREIGN KEY (cpno) REFERENCES course (cno) 
); 
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同样 ,也 可 以 通过 系统 提供 的 CONSTRAINT 关键 字 来 实现 外 键 约束 。 
【 例 9.12】 对 选课 表 定 义 外 键 约束 。 


CREATE TABLE sc( 

sno CHAR(10), 

cno INT, 

grade DECIMAL (3,1), 

PRIMARY KEY (sno, cno), 

CONSTRAINT fk _sno FOREIGN KEY (sno)REFERENCES student (sno), 
CONSTRAINT fk_cno FOREIGN KEY (cno)REFERENCES course (cno) 
); 


通过 参照 完整 性 就 把 学 生 表 和 选课 表 两 个 表 相应 的 元 组 联系 起 来 了 。 加 入 外 键 约束 
后 ,DBMS 对 增删 \ 改 数据 操作 采取 一 定 的 策略 。 

考虑 以 下 情况 : 

(1) 对 选课 表 新 增加 一 行 数据 时 ,其 新 增加 的 学 号 值 不 是 学 生 表 中 存在 的 学 生 。 

(2) 对 选课 表 修 改 学 号 值 时 ,其 修改 后 的 学 号 值 不 是 已 存在 的 学 生 表 中 的 学 生 。 

(3) 修改 学 生 表 的 学 号 值 ,造成 选课 表 的 某 些 元 组 的 学 号 值 在 学 生 表 中 找 不 到 对 应 
的 元 组 。 

(4) 删除 学 生 表 的 数据 ,造成 选课 表 的 某 些 元 组 的 学 号 值 在 学 生 表 中 找 不 到 对 应 的 元 组 。 

当 以 上 情况 发 生 时 ,系统 可 以 采用 如 下 策略 之 一 。 

(1) 拒绝 执行 (关键 字 NO ACTION) 该 操作 ,一 般 是 系统 的 默认 策略 。 

(2) 级 联 操作 (关键 字 CASCADE) , 即 修改 和 删除 被 参照 表 的 被 参照 属性 值 时 ,相应 
的 参照 表 的 外 键 的 值 也 跟着 相应 变化 。 如 删除 学 生 表 中 的 某 个 学 生 时 ,其 在 选课 表 中 的 
相应 选课 记录 同时 被 删除 。 

(3) 设置 为 空 值 (关键 字 SET NULL), 即 修改 和 删除 被 参照 表 的 被 参照 属性 值 时 ， 
相应 的 参照 表 的 外 键 的 值 设置 为 空 值 。 

【 例 9.13】 对 选课 表 定 义 外 键 约束 ,并 设置 相应 的 策略 。 


CREATE TABLE sc( 

sno CHAR(10), 

cno INT, 

grade DECIMAL (3,1), 

PRIMARY KEY (sno, cno), 

CONSTRAINT fk_sno FOREIGN KEY (sno)REFERENCES student (sno) 
ON DELETE CASCADE 

ON UPDATE CASCADE, 

CONSTRAINT fk_cno FOREIGN KEY (cno)REFERENCES course (cno) 
ON DELETE NO ACTION 

ON UPDATE NO ACTION 

); 


该 例子 对 选课 表 的 外 键 sno 设置 成 级 联 删除 和 级 联 修 改 , 当 有 学 生 表 中 的 学 生 被 删 
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除 或 者 修改 时 ,其 对 应 的 选课 记录 分 别 级 联 删 除 或 者 级 联 修改 。 对 外 键 cno 的 策略 则 设 
置 成 拒绝 执行 , 即 当 有 课程 表 的 课程 被 删除 或 者 修改 时 ,系统 会 禁止 执行 该 操作 ,因为 选 
课表 引用 了 该 课程 记录 。 


3. 用 户 自 定义 约束 


用 户 自 定义 约束 多 种 多 样 ,一 般 是 根据 用 户 需求 或 者 应 用 环境 需求 进行 设置 的 ,包含 
上 默认 约束 (DEFAULT)、 检 查 约束 (CHECK)、 非 空 约束 (NOT NULL) 、 唯 一 约束 
(UNIQUE) 等 。 

【 例 9.14】 创建 student 表 , 添 加 用 户 自 定义 约束 ,年 龄 在 某 个 范围 之 内 ,专业 默认 
为 cs。 

















CREATE TABLE student ( 

sno CHAR(10), 

sname VARCHAR (20) ， 

sage int CHECK (sage<= 35 AND sage>=15), 
sdept CHAR (20) DEFAULT "cs 

sex CHAR(2), 

PRIMARY KEY (sno) 

); 


可 以 写成 如 下 语句 。 


CREATE TABLE student ( 

sno CHRR (10) ， 

sname VARCHAR (20) ， 

sage INT, 

sdept CHAR (20) DEFAULT "cs' 
sex CHAR(2), 

PRIMARY KEY (sno), 

CHECK (sage<= 35 AND sage>=15) 
); 


或 者 采用 关键 字 CONSTRAINT 来 引导 约束 。 


CREATE TABLE student ( 

sno CHAR(10), 

sname VARCHAR (20), 

sage INT CONSTRAINT ck _sage CHECK (sage<= 35 AND sage>=15), 
sdept CHAR (20) DEFAULT 'cs', 

sex CHAR(2), 

PRIMARY KEY (sno) 

); 


【 例 9.15】 创建 course 表 , 课 程 名 唯一 旦 必须 输入 值 。 

















CREATE TABLE course( 
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cno INT PRIMARY KEY, 

cname VARCHAR (50) UNIQUE NOT NULL, 

credit DECIMAL (2,1), 

cpno INT 

); 

前 面 所 学 的 实体 完整 性 约束 由 UNIQUE 和 PRIMARY KEY 实现 ;参照 完整 性 约束 
由 FOREIGN KEY 实现 ;用 户 自 定义 约束 由 CHECK、DEFAULT、NOT NULL 等 实现 。 

完整 性 约束 对 象 可 以 是 列 \ 元 组 ,关系 3 类 。 列 级 约束 主要 限制 单个 属性 取 值 ,如 对 
属性 的 取 值 范围 .属性 取 值 的 格式 、 属 性 取 值 的 精度 等 。 元 组 约束 定义 几 个 属性 值 之 间 的 
联系 ,如 工资 表 中 包含 应 发 工资 . 实 发 工资 等 列 ,要 求实 发 工资 不 能 大 于 应 发 工资 。 表 级 
约束 定义 多 个 表 之 间 的 联系 ,以 及 多 个 元 组 之 间 的 联系 ,如 外 键 约束 。 


9.2.3 模式 修改 语句 


1. 修改 表 结 构 
修改 表 结 构 的 语句 格式 : 


ALTER TABLE < 表 名 > 

[ADD [COLUMN] < 新 列 名 >< 数 据 类 型 > [ 列 完整 性 约束 条 件 ]] 
[app< 表 级 完整 性 约束 >] 

[DROP [COLUMN]< 列 名 > [CASCADE |RESTRICT]] 

[DROP CONSTRAINT < 完整 性 约束 名 > [CASCADE |RESTRICT]] 
[ALTER[COLOMN]< 列 名 >< 数 据 类 型 > ]; 


【 例 9.16】 在 student 表 结构 中 增加 一 个 电话 号 码 (stel) 属 性 。 
ALTER TABLE student ADD stel CHAR (20)NOT NULL; 

【 例 9.17】 删除 student 表 的 stel 属性 。 

ALTER TABLE student DROP stel; 

【 例 9.18】 修改 student 表 的 stel 列 的 属性 。 


ALTER TABLE student ALTER stel CHAR (12) 7 


2. 添加 约束 


可 以 在 表 创 建 好 后 ,对 表 添 加 约束 。 
假设 学 生 表 、 课 程 表 及 选课 表 上 没有 约束 ,可 对 其 添加 约束 。 
【 例 9.19】 对 学 生 表 student 添加 主键 约束 。 


ALTER TABLE student 
RDD CONSTRAINT pk_sno PRIMARY KEY (sno); 
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【 例 9. 20〗 对 选课 表 sc 添加 外 键 约束 。 


ALTER TABLE sc 
RDD CONSTRAINT fk sno FOREIGN KEY (sno)REFERENCES student (sno); 


【 例 9.21】 对 学 生 表 student 添加 check 约束 。 


RLTER TRBIE student 
RDD CONSTRAINT ck sage CHECK (sage<=35 RND sage>=15); 


3. 删除 数据 库 表 对 象 
语句 格式 : 
DROP TABLE < 表 名 >; 


删除 表 结构 时 , 表 中 的 数据 也 一 并 删除 。 因 此 ,删除 表 要 慎重 ! 
【 例 9.22】 删除 课程 表 course。 


DROP TABLE course; 


9.2.4 应 用 举例 


定义 第 2 童 中 公司 示例 数据 库 的 6 个 表 , 并 定义 相关 的 约束 。 


CREATE TABLE employee 

( 

name CHAR (20) NOT NULL UNIQUE, 
ssn CHAR (9) PRIMARY KEY, 

bdate DATETIME, 

address CHAR (50) ， 

ssex CHAR(2)CHECK (ssex= ' 男 'OR ssex= ' 女 ')， 
salary INT, 

superssn CHAR (9) 

dno INT 

); 

CREATE TABLE department ( 

dname CHAR(20), 

dnumber INT PRIMARY KEY, 

mgrssn CHAR(9), 

mgrstartdate DATETIME, 

FOREIGN KEY (mgrssn)REFERENCES employee (ssn) 
); 

CREATE TABLE dept locations( 
dnumber INT, 

dlocation CHAR (50), 

PRIMARY KEY (dnumber, dlocation), 
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CONSTRAINT fk dnumber FOREIGN KEY (dnumber)REFERENCES department (dnumber) 
); 

CREATE TABLE project ( 

Pname CHAR (20) CONSTRAINT not null pname NOT NULL, 

pnumber INT, 

plocation CHAR(50), 

dnum INT, 

CONSTRAINT pk_pnumber PRIMARY KEY (pnumber), 

FOREIGN KEY (dnum) REFERENCES department (dnumber) 

); 

CREATE TABLE works_on( 

essn CHAR(9), 

pno INT, 

hours DECIMAL (3,1), 

PRIMARY KEY (essn, pno), 

FOREIGN KEY (essn) REFERENCES employee (ssn) 

ON DELETE CASCADE 

ON UPDATE CASCADE, 

FOREIGN KEY (pno) REFERENCES project (pnumber) 

ON DELETE CASCADE 

ON UPDATE CASCADE, 

CONSTRAINT ck_hours CHECK (hours> 0 AND hours< 40) 

); 

CREATE TABLE dependent ( 

essn CHAR (9) ， 

dependent_name CHAR(20), 

ssex CHAR (2), 

bdate DATETIME, 

relationship CHAR(10), 

CONSTRAINT ck_sex CHECK(ssex IN(' 男 ', ' 女 '))， 

CONSTRAINT pk_essn PRIMARY KEY (essn, dependent_name), 
CONSTRAINT fk_essn FOREIGN KEY (essn)REFERENCES employee (ssn) 
ON DELETE NO ACTION 

ON UPDATE NO ACTION 

); 

ALTER TABLE employee 

ADD CONSTRAINT fk _dno FOREIGN KEY (dno)REFERENCES department (dnumber); 
ALTER TABLE employee 

ADD CONSTRAINT fk_superssn FOREIGN KEY (superssn)REFERENCES employee (ssn); 


9.3 ”查询 


数据 查询 是 数据 库 系 统 最 常用 的 一 项 操作 。DBMS 必须 提供 强大 而 完善 的 数据 查 
询 功 能 。 对 于 关系 数据 库 , 查 询 有 时 可 能 需要 从 多 个 表 中 取得 数据 。SQL 只 用 SELECT 
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就 能 完成 各 种 查询 。 数 据 查 询 涉及 单 表 查 询 、 多 表 查 询 .和 嵌 套 查询 、 集 合 查询 等 内 容 。 
1. 查询 语句 的 一 般 语 法 格式 
查询 语句 的 一 般 语 法 格式 如 下 : 
SELECT [ALLIDISTINCT] < 目标 列表 达 式 > [别名 ] [,< 目 标 列表 达 式 > [别名 ] ]… 
FROM < 表 名 或 视图 名 > [,< 表 名 或 视图 名 >…]1(<SELECT 语句 >) [AS]< 别 名 > 
[WHERE < 条 件 表达 式 >] 
[GROUP BY < 列 名 1> [HAVING < 条 件 表 达 式 >]] 
[ORDER BY < 列 名 2> [ASCIDESC]]; 
其 语法 格式 说 明 如 下 。 
(1) 目标 列表 达 式 可 以 有 以 下 格式 。 
ci 
@ < 表 名 > .* 
@ couNT([ALLIDISTINCT] x | 属性 列 名 ) 
@ [< 表 名 > .]< 属 性 列 名 表达 式 > [别名 ] 


(2) WHERE 条 件 表达 式 非常 灵活 。 

(3) GROUP BY 表示 按 列 名 1 的 值 分 组 。HAVING 二 条 件 表达 式 二 表示 符合 条 
件 的 组 才 输 出 。 

(4) [ORDER BY 二 列 名 2 之 [ASC | DESC]]: 表示 查询 结果 按 列 名 2 升序 或 者 降 
序 排序 。 


2. SQL 语句 的 含义 


整个 SQL 语句 的 含义 是 ,根据 WHERE 子 句 的 条 件 表达 式 从 FROM 子 句 指定 的 基 
本 表 、 视 图 、 派 生 表 中 找 出 满足 条 件 的 元 组 ,再 按 SELECT 子 句 中 的 目标 列表 达 式 选 出 元 
组 中 的 属性 值 形成 结果 表 。 

如 果 SQL 语句 中 有 GROUP BY 子 句 , 则 查询 结果 按 志 列 名 1 二 进行 分 组 ,该 属性 列 
值 相等 的 元 组 为 一 个 组 。 通 常会 在 每 组 中 使 用 聚集 函数 。 如 果 GROUP BY 子 句 后 带 有 
HAVING 短语 , 则 只 有 满足 指定 条 件 的 组 才 会 输出 。 

如 果 SQL 语句 中 有 ORDER BY 子 句 , 则 查询 结果 将 按 二 列 名 2 之 进行 升序 或 者 降 
序 排序 。 


9.3.1 单 表 查 询 


单 表 查 询 即 简单 查询 , 仅 涉 及 一 个 表 的 查询 。 
1. 查询 输出 选择 若干 属性 列 





查询 结果 可 以 输出 指定 列 、 输 出 全 部 列 、 输 出 经 过 计算 的 列 。 
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1) 输出 指定 列 
【 例 9.23】 查询 全 体 学 生 的 姓名 。 


SELECT sname 
EROM student; 


【 例 9. 24】 查询 全 体 学 生 的 学 号 及 姓名 。 


SELECT sno, sname 

FROM student; 

2) 输出 全 部 列 

【 例 9.25】 查询 学 生 的 所 有 基本 信息 ,用 * 表示 所 有 字段 ,或 者 列 出 所 有 的 属性 名 。 
SELECT * 

FROM student; 

3) 给 列 设置 别名 

【 例 9.26】 给 输出 列 设置 别名 ,如 sno 的 别名 为 学 号 。 
SELECT sno 学 号 ,sname 姓名 

FROM student; 

4) 输出 经 过 计算 的 列 

【 例 9.27】 输出 列表 达 式 。 


(1) SELECT sno+ sname RS 学 号 姓名 
FROM student; 


(2) SELECT sno,sage-1 
FROM student; 
5) 比较 关键 字 ALL 与 DISTINCT 的 区 别 
ALL 表示 列 出 该 列 的 所 有 值 ,DISTINCT 表示 列 出 此 列 所 有 不 同 的 值 , 默 认 情 况 下 
列 出 所 有 的 值 ( 省 略 ALL) 。 
【 例 9. 28〗 查询 学 生 的 年 龄 ,有 以 下 3 种 表示 方法 ,第 一 种 和 第 二 种 表示 方法 的 结 
果 相 同 ,第 三 种 表示 方法 的 结果 与 前 两 种 表示 方法 的 结果 不 同 。 
(1) SELECT sage 
FROM student; 


(2) SELECT ALL sage 
FROM student; 


(3) sELECT DISTINCT sage 
FROM student; 


2. 查询 输出 满足 条 件 的 行 
查询 输出 满足 条 件 的 行 ,其 中 条 件 包 括 : 比较 大 小 、 确 定 范围 .确定 集合 .字符 匹配 、 
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空 值 .多 重 条 件 等 ,主要 用 WHERE 关键 字 来 引导 条 件 表达 式 。WHERE 条 件 表达 式 相 
当 灵 活 ,可 以 表示 很 多 复杂 的 条 件 , 主 要 有 以 下 表达 方式 ,如 表 9.5 所 示 。 


表 9.5 WHERE 条件 表达 式 





查询 条 件 谓 词 
比较 大 小 =,>, 达 ,>= ,过 =,!= ,过 >>,! 过 ,!>>;NOT 加 上 述 符号 
确定 范围 BETWEEN AND, NOT BETWEEN AND 
确定 集合 IN,NOT IN 
字符 匹配 LIKE(%, ),NOT LIKE(%,) 
空 值 IS NULL,IS NOT NULL 
多 重 条 件 AND,OR,NOT 





(1) 查询 条 件 为 确定 范围 .比较 大 小 、 确 定 集合 多重 条 件 。 
【 例 9. 29】 查询 年 龄 为 19 岁 的 学 生 信息 。 


SELECT * 
EROM student 
WHERE sage=19; 


【 例 9.30】 查询 姓名 为 刘 佳 的 信息 。 


SELECT * 
FROM student 
WHERE sname= " 刘 佳 '; 
【 例 9.31】 查询 年 龄 为 18 岁 或 者 19 岁 的 学 生 姓名 。 以 下 3 种 表示 方法 都 可 以 ,分 
别 用 关系 运算 符 ,范围 表示 以 及 OR 条 件 实 现 。 
© sELEcCT sname 
FROM student 
WHERE sage<=19 AND sage>=18; 
© sELECT sname 


FROM student 
WHERE sage BETWEEN 18 AND 19; 


人 sELECT sname 
FROM student 
WHERE sage=18 OR sage= 197 


【 例 9.32】 查询 姓名 为 孙 晋 和 张 慧 的 信息 。 


SELECT * 

FROM student 

WHERE sname IN(" 孙 晋 ', ' 张 慧 '); 

(2) 查询 条 件 为 字符 串 匹 配 。 

字符 串 模 糊 匹配 采用 关键 字 LIKE, 其 中 涉及 通配符 % 及 _, 通 配 符 % 表 示 任 意 长 度 
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的 字符 串 ;通配符 _ 表 示 任 意 一 个 字符 。 


【 例 9.33】 查询 姓 何 的 学 生 信息 。 


SELECT sno, sname 
EROM student 
WHERE sname LIKE' 何 $"; 


【 例 9.34】 查询 姓名 中 包含 “ 佳 "的 学 生 信息 。 


SELECT * 
FROM student 
WHERE sname LIKE '% 住 %"; 


【 例 9.35】 查询 课程 名 称 以 c 开头 ,第 二 个 字符 为 任意 字符 ,以 design 结尾 的 课程 


信息 。 


SELECT 关 

FROM course 

WHERE cname LIKE'c design'; 

如 果 查 询 的 内 容 本 身 含 有 % 或 者 _ 字 符 , 就 需要 使 用 转 义 字符 ,即使 用 关键 字 ESCAPE。 
【 例 9.36】 查询 课程 名 称 为 c_design 的 信息 ,有 以 下 两 种 表示 方法 , 转 义 字符 可 以 


是 任意 字符 。 这 里 ,(1) 中 的 左 斜 线 为 转 义 字 符 ,(2) 中 的 右 斜 线 为 转 义 字符 。 


(1) SELECT * 
FROM course 
WHERE cname LIKE 'c\ design' ESCAPE'\'; 


(2) SELECT * 
FROM course 
WHERE cname LIKE'c/_design' ESCRPE '/ "7 


3. 使 用 聚集 函数 


在 查询 的 输出 列表 达 式 中 可 以 使 用 聚集 函数 。 聚 集 函 数 包括 如 下 。 
COUNT(LDISTINCTI ALL] * ): 统计 元 组 个 数 。 
COUNT(LDISTINCT| ALL] 去 列 名 之 ) : 统计 一 列 中 值 的 个 数 。 
SUM([DISTINCT| ALL] 雪 列 名 之 ) : 计算 一 列 值 的 总 和 。 
AVG([DISTINCT| ALL] 二 列 名 之 ) : 计算 一 列 值 的 平均 值 。 
MAX([LDISTINCT| ALL] 区 列 名 之 ) : 计算 一 列 值 的 最 大 值 。 
MIN(CLDISTINCTI ALL] 二 列 名 之 ) : 计算 一 列 值 的 最 小 值 。 

【 例 9.37】 查询 学 生 的 人 数 , 有 以 下 两 种 表示 方法 。 


(1) SELECT COUNT (sno) 
FROM student; 


(2) SELECT COUNT(* ) 
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FROM student; 


4. 分 组 


(1) 对 查询 结果 进行 分 组 ,采用 关键 字 GROUP BY 
合 起 来 使 用 。 
【 例 9.38】 查询 男生 和 女生 的 人 数 。 


SELECT ssex,COUNT (sno) 
FROM student 
GROUP BY ssex; 


【 例 9.39】 查询 男生 及 女生 的 平均 年 龄 。 


SELECT ssex, AVG (sage) 
FROM student 
GROUP BY ssex; 


【 例 9.40】 查询 每 个 系 学 生 的 平均 年 龄 。 


SELECT sdept, AVG (sage) 
FROM student 
GROUP BY sdept; 


【 例 9.41】 查询 每 个 系 最 大 的 学 生年 龄 。 


SELECT sdept,MAX (sage) 
FROM student 
GROUP BY sdept; 


【 例 9.42】 查询 每 门 课程 的 选课 人 数 。 


SELECT cno,COUNT (sno) 
EROM sc 
GROUP BY cno; 


【 例 9.43】 查询 每 个 学 生 的 选课 门 数 。 


SELECT sno,COUNT (cno) 
FROM sc 
GROUP BY sno 


【 例 9.44】 查询 每 门 课 的 平均 成 绩 。 


SELECT cno,AVG (grade) 
FROM sc 
GROUP BY cno; 


。 一 般 来 说 ,分 组 语句 和 聚集 函 


(2) 对 分 组 设置 限定 条 件 用 关键 字 HAVING 表示 ,满足 条 件 的 分 组 才 在 结果 中 
列 出 。 


和 
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【 例 9.45】 查询 至 少 有 2 个 学 生 选 修 的 课程 。 


SELECT cno,COUNT (sno) 
FROM sc 


GROUP BY cno HAVING COUNT (sno)>=2; 
【 例 9. 46】 查询 至 少 选修 了 2 门 及 2 门 以 上 课程 的 学 生 。 


SELECT sno, COUNT (cno) 
FROM sc 
GROUP BY sno HAVING COUNT (cno)>=2; 


5. 对 查询 结果 排序 
对 查询 结果 进行 排序 ,采用 关键 字 ORDER BY。 
【 例 9.47】 查询 学 生 信息 ,结果 按照 姓名 升序 输出 。 以 下 两 种 方法 结果 相同 。 


(1) sELECT sno, sname 
FROM student 
ORDER BY sname; 


(2) SELECT sno, sname 
FROM student 
ORDER BY sname ASC; 


【 例 9.48】 查询 学 生 信息 ,结果 按照 姓名 降序 输出 。 


SELECT sno, sname 
FROM student 
ORDER BY sname DESC; 


2 多 表 查 询 


当 查询 涉及 多 个 表 时 ,这 些 表 就 需要 进行 笛 卡 儿 积 或 者 进行 连接 才 可 以 获得 正确 答案 。 


本 节 的 内 容 是 关系 代数 操作 理论 中 讲述 过 的 笛 卡 儿 积 ,内 连接 .外 连接 的 SQL 实现 内 容 。 


当 查 询 涉 及 两 个 表 时 ,一 般 格 式 如 下 所 示 。 
[ 表 名 1.] 列 名 1 ”比较 运算 符 ”[ 表 名 2.] 列 名 2 
以 上 语句 完整 的 表现 形式 为 


SELECT [ALL | DISTINCT] < 目标 列表 达 式 > [别名 ] [,< 目 标 列表 达 式 > [别名 ] ]… 
FROM < 表 名 1 或 视图 名 > [,< 表 名 2 或 视图 名 >…]1(<SEIECT 语句 >) [AS]< 别 名 > 
[WHERE [ 表 名 1.] 列 名 1 比较 运算 符 [ 表 名 2.] 列 名 2 [andlor] 条 件 表达 式 …] 
[GROUP BY < 列 名 1> [HAVING < 条 件 表达 式 > ]] 

[ORDER BY < 列 名 2 > [ASC | DESC]]; 
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该 语句 的 功能 是 为 多 个 表 进 行 笛 卡 儿 积 , 选 出 满足 比较 运算 符 条 件 的 那些 行 。 


1. 笛 卡 儿 积 


【 例 9. 49】 


SELECT student. 关 ,sc.* 


FROM student, sc; 


该 查询 的 结果 实际 是 没有 意义 的 , 它 是 由 学 生 表 和 选课 表 进 行 笛 卡 儿 积 ,结果 如 





























表 9.6 所 示 。 
表 9.6 第 卡 儿 积 结果 
sno sname SSeX Sage sdept sno cno grade 
160610101 刘 佳 女 19 physics 160610101 1 91 
160610101 刘 佳 女 19 physics 160610101 2 87 
160610101 刘 佳 女 19 physics 160610101 3 88 
160610101 刘 佳 女 19 physics 160610102 2 90 
160610101 刘 佳 女 19 physics 160610102 3 81 
160610102 何 鹏 男 20 network 160610101 | 91 
160610102 何 鹏 男 20 network 160610101 2 87 
160610102 何 鹏 男 20 network 160610101 3 88 
160610102 何 鹏 男 20 network 160610102 2 90 
160610102 何 鹏 男 20 network 160610102 3 81 
160610103 孙 晋 男 18 computer 160610101 1 91 
160610103 孙 晋 男 18 computer 160610101 2 87 
160610103 孙 晋 男 18 computer 160610101 3 88 
160610103 孙 晋 男 18 computer 160610102 2 90 
160610103 孙 晋 男 18 computer 160610102 81 
160610105 张 慧 女 19 database 160610101 1 91 
160610105 张 慧 女 19 database 160610101 2 87 
160610105 张 慧 女 19 database 160610101 尝 88 
160610105 张 慧 女 19 database 160610102 2 90 
160610105 张 慧 女 19 database 160610102 3 81 
1) 等 值 连接 


【 例 9.50】 查询 刘 佳 同学 选修 的 所 有 课 的 课程 号 。 


SELECT cno 


FROM student, sc 
WHERE sc.sno= student.sno 


RND sname= " 刘 佳 '; 


此 查询 中 涉及 学 生 表 和 选课 表 , 这 两 个 表 进 行 笛 卡 儿 积 后 , 选 出 刘 佳 所 选 的 课程 , 即 
选 出 同时 满足 两 个 条 件 的 那些 行 。 第 一 个 条 件 是 学 生 表 的 学 号 值 和 选课 表 的 学 号 值 相等 


的 那些 行 ;第 二 个 条 件 是 与 刘 佳 同学 的 学 号 相同 的 那些 行 , 结 果 如 下 。 
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cno 














【 例 9.51】 查询 选修 了 数据 库 这 门 课程 的 学 生 的 学 号 。 


SELECT sno 
FROM course, sc 


WHERE course.cno= sc.cno RND cname= ' 数 据 库 '; 


此 查询 中 涉及 课程 表 和 选课 表 , 这 两 个 表 进 行 笛 卡 儿 积 后 , 选 出 同时 满足 两 个 条 件 的 
那些 行 。 第 一 个 条 件 是 课程 表 的 课程 号 值 和 选课 表 的 课程 号 值 相 等 的 那些 行 ; 第 二 个 条 
件 是 选 出 课程 号 值 与 数据 库 的 课程 号 相同 的 那些 行 。 

【 例 9. 52】〗 查询 学 校 开设 课程 的 选修 情况 。 


SELECT sc.* ,Course.* 
FROM sc, course 


WHERE sc.cno= course.cno; 


此 查询 中 涉及 课程 表 和 选课 表 , 这 两 个 表 进 行 笛 卡 儿 积 后 , 选 出 课程 表 中 课程 号 值 与 
选课 表 中 的 课程 号 相同 的 那些 行 ,结果 如 表 9.7 所 示 。 
表 9.7 课程 的 被 选 情况 








sno ccredit 
160610101 4 
160610101 2 
160610101 4 
160610102 2 
160610102 4 
2) 不 等 值 连接 


【 例 9.53】 比较 不 同学 生 同 一 科目 之 间 成 绩 的 高 低 ,其 结果 如 表 9. 8 所 示 。 


SELECT DISTINCT sc1. 关 ，SC2. 闪 
FROM sc scl,sc sc2 


WHERE scl .grade <= sc2.grade AND scl.sno!= sc2.sno RND scl.cno= sc2.cno; 


表 9.8 不 同学 生 同 一 科目 之 间 成 绩 的 高 低 结果 





Scl. sno scl. cno scl. grade Sc2. sno Sc2. cno Sc2. grade 
160610101 2 87 160610102 2 90 
160610102 3 81 160610101 3 88 

2. 内 连接 


内 连接 的 关键 字 为 INNER JOIN ,完整 的 SQL 语句 表现 形式 为 
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SELECT [ALL | DISTINCT] < 目标 列表 达 式 > [别名 ] [,< 目 标 列表 达 式 > [别名 ] ]… 
FROM < 表 名 1 或 视图 名 > [, INNER JOIN < 表 名 2 或 视图 名 > 

ON < 表 名 1. 列 名 1= 1 其 他 比较 运算 符 表 名 2. 列 名 2>… 

[WHERE < 条 件 表达 式 >] 

[GROUP BY < 列 名 1> [HAVING < 条 件 表达 式 >]] 

[ORDER BY < 列 名 2 > [ASC | DESC]]; 


【 例 9.54】 查询 刘 佳 同学 选修 的 所 有 课 的 课程 号 。 


SELECT cno 

FROM student INNER JOIN sc 
ON sc.sno= student .sno 
WHERE sname= '" 刘 佳 '; 


此 查询 中 涉及 学 生 表 和 选课 表 , 这 两 个 表 在 学 号 这 一 列 上 进行 等 值 连接 后 , 选 出 姓名 


为 刘 佳 的 那些 行 。 


【 例 9.55】 查询 选修 了 数据 库 这 门 课程 的 学 生 的 学 号 。 


SELECT sno 
FROM course INNER JOIN sc 


ON course.cno=sc.cno RND cname= ' 数 据 库 '; 


此 查询 中 涉及 课程 表 和 选课 表 , 这 两 个 表 在 课程 号 上 进行 等 值 连接 后 , 选 出 课程 名 为 


数据 库 的 那些 行 。 


【 例 9. 56】 查询 学 校 开设 课程 的 选修 情况 。 


SELECT SC.。# ,Course.* 
FROM sc INNER JOIN course 


ON sc.cno= course.cno7 


此 查询 中 涉及 课程 表 和 选课 表 , 这 两 个 表 在 课程 号 上 进行 等 值 连接 。 
自然 连接 是 在 等 值 连接 的 基础 上 去 掉 重 复 的 属性 列 。 

【 例 9.57】 查询 学 生 的 选课 情况 。 

第 一 种 实现 方式 ,如 表 9.9 所 示 。 


SELECT student.* ,sc.* 
FROM student INNER JOIN sc 


ON sc.sno= student .sno; 


表 9.9 学 生 的 选课 情况 一 





sno sname SSeX Sage sdept Sno cno grade 
160610101 刘 佳 女 19 physics 160610101 1 91 
160610101 刘 佳 k 19 physics 160610101 87 
160610101 刘 佳 女 19 physics 160610101 3 88 
160610102 何 鹏 男 20 network 160610102 条 90 
160610102 何 鹏 男 20 network 160610102 3 81 
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第 二 种 实现 方式 ,如 表 9. 10 所 示 。 


SELECT student. * ,cno,grade 
EROM student INNER JOIN sc 


ON sc.sno= student .sno; 


表 9.10 学 生 的 选课 情况 二 





sno sname SSeX Sage sdept cno grade 
160610101 刘 佳 女 19 physics 1 91 
160610101 刘 佳 有 19 physics 多 87 
160610101 刘 佳 女 19 physics 3 88 
160610102 何 鹏 男 20 network 2 90 
160610102 何 鹏 男 20 network 3 81 





其 中 第 二 种 实现 方式 就 是 自然 连接 , 它 是 在 第 一 种 实现 方式 等 值 连接 结果 中 去 掉 重 
复 的 属性 列 sno。 


3. 外 连接 


全 外 连接 的 关键 字 为 [FULL]OUTER JOIN , 左 外 连接 的 关键 字 为 LEFT OUTER 
JOIN , 右 外 连接 的 关键 字 为 RIGHT OUTER JOIN。 外 连接 的 完整 SQL 语句 表现 形 
式 为 


SELECT [ALL | DISTINCT] < 目标 列表 达 式 > [别名 ] [,< 目 标 列表 达 式 > [别名 ] ]… 
FROM < 表 名 1 或 视图 名 > [,LEFT|IRIGHT|FULL OUTER JOIN < 表 名 2 或 视图 名 > 

ON < 表 名 1. 列 名 1= | 其 他 比较 运算 符 表 名 2. 列 名 2>… 

[WHERE < 条 件 表达 式 > ] 

[GROUP BY < 列 名 1> [HAVING < 条 件 表达 式 > ]] 

[ORDER BY < 列 名 2 > [ASC | DESC]]; 


【 例 9.58】 
所 示 。 


查询 所 有 学 生 的 基本 信息 及 选 了 课 的 学 生 的 选课 情况 ,结果 如 表 9. 11 


SELECT student. 关 ,sc.* 
FROM student LEFT OUTER JOIN sc 


ON student .sno= sc.sno; 


在 此 查询 中 ,要求 查 询 结果 既 包含 选 了 课 的 学 生 信息 ,又 包含 没有 选课 的 学 生 信息 ， 
因此 用 到 左 外 连接 。 


表 9.11 所 有 学 生 的 基本 信息 及 选 了 课 的 学 生 的 选课 情况 


























Sno sname SSeX Sage sdept sno cno grade 
160610101 刘 佳 女 19 physics 160610101 1 91 
160610101 刘 佳 女 19 physics 160610101 2 87 
160610101 刘 佳 女 19 physics 160610101 E 88 








147 











数据 库 原理 及 应 用 





续 表 
sno sname SSeX Sage sdept sno cno grade 
160610102 何 鹏 男 20 network 160610102 2 90 
160610102 何 鹏 男 20 network 160610102 3 81 
160610103 晋 男 18 computer 
160610105 张 慧 女 19 database 





【 例 9. 59】 查询 所 有 课程 的 基本 信息 及 被 选修 的 情况 ,结果 如 表 9. 12 所 示 。 


SELECT sc.* ,Course.* 


FROM sc RIGHT OUTER JOIN course 


ON sc.cno= course.cno; 


在 此 查询 中 ,要 求 查询 结果 既 包 含 被 选修 了 的 课程 信息 ,又 包含 没有 被 选修 的 课程 信 























息 , 因 此 用 到 右 外 连接 。 
表 9.12 所 有 课程 的 基本 信息 及 被 选 情况 
sno cno grade cno cname cpno ccredit 
160610101 Hi 91 于 数据 库 5 4 
160610101 2 87 2 数学 多 
160610101 3 88 3 信息 系统 1 4 
160610102 2 90 2 数学 2 
160610102 3 81 3 信息 系统 1 4 
4 操作 系统 6 3 
5 数据 结构 党 4 
6 计算 机 网 络 4 3 
Y C 语言 6 4 
8 大 学 物理 多 4 
4. 自身 连接 


自身 连接 即 同一 个 表 与 自己 进行 连接 ,是 多 表 查 询 中 的 一 种 特殊 情况 。 
【 例 9.60】 求 出 每 门 课程 的 直接 先 修 课 程 。 

第 一 种 实现 方式 ( 笛 卡 儿 积 ); 

SELECT cl .cname, c2.cname 


FROM course cl,course c2 


WHERE cl1.cpno= c2.cno; 
第 二 种 实现 方式 (内 连接 ) : 


SELECT cl .cname, c2.cname 
EROM course cl INNER JOIN course c2 


ON cl.cpno=c2.cno; 


在 该 查询 中 ,课程 表 和 自己 进行 等 值 连接 ,这 时 需要 为 每 个 表 设 置 一 个 别名 ,表示 存 
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在 两 个 一 模 一 样 的 课程 表 , 只 是 名 字 分 别 为 cl 和 c2, 选 出 的 cl 表 的 先 修 课 程 号 值 与 c2 
表 的 课程 号 值 相同 的 那些 行 就 是 查询 结果 。 
【 例 9.61】 查询 和 刘 佳 同学 在 同一 个 系 的 学 生 姓 名 。 


SELECT s2.sname 

FROM student sl, student s2 

WHERE s1.sdept= s2.sdept AND sl.sname= ' 刘 佳 ' 
RND s2.sname!= '" 刘 佳 '; 


5. 多 表 连 接 (3 个 及 3 个 以 上 的 表 ) 


查询 涉及 3 个 及 3 个 以 上 的 表 时 ,两 两 表 之 间 进 行 等 值 连接 。 
【 例 9.62】 查询 出 刘 佳 同学 选修 的 所 有 课 的 课程 名 。 


SELECT cname 

FROM sc, student, course 

WHERE student.sno= sc.sno RND sc.cno= course.cno 
RND sname= '" 刘 佳 '; 


SELECT cname 

FROM sc INNER JOIN student 

ON student .sno= sc.sno INNER JOIN course on sc.cno= course.cno 
RND sname= '" 刘 佳 '; 


9.3.3 其 套 查 询 


嵌 套 查询 指 的 是 一 个 查询 块 (SELECT-FROM-WHERE) 榜 入 到 另 一 个 查询 块 中 。 
被 嵌 套 的 查询 叫 父 查询 或 者 外 查询 , 嵌 套 的 查询 叫 子 查询 或 内 查询 。 嵌 套 查 询 分 为 两 类 ， 
相关 的 嵌 套 查询 和 不 相关 的 嵌 套 查询 。 

不 相关 的 嵌 套 查询 可 以 采用 以 下 方式 引导 子 查询 。 

。 用 IN 谓词 引导 子 查询 。 

。 用 比较 运算 符 引导 子 查询 。 

。 用 ANY、SOME、ALL 引导 子 查询 。 

而 相关 子 查询 除了 可 以 用 以 上 方式 引导 子 查询 外 ,还 可 以 用 EXISTS 引导 子 查 询 。 


1. 不 相关 的 嵌 套 查询 


不 相关 的 嵌 套 查询 指 的 是 查询 的 执行 过 程 是 由 内 到 外 的 顺序 , 即 先 执行 内 查询 ,再 执行 
外 查询 。 内 查询 的 查询 结果 作为 外 查询 的 查询 条 件 ,而 且 内 查询 和 外 查询 都 只 执行 一 次 。 

1) 用 比较 运算 符 引 导 子 查询 

用 比较 运算 符 引 导 子 查询 是 指 父 查询 与 子 查询 之 间 用 比较 运算 符 进行 连接 , 当 内 查 
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询 返回 的 是 单个 值 时 ,可 以 用 > 一 、 雪 一、 过 > 一 、! 一 或 者 一 > 去 连接 子 查询 。 
【 例 9. 63】 查询 刘 佳 同学 选修 的 课程 号 。 


SELECT cno 
FROM sc 
WHERE sno= 
(SELECT sno 
FROM student 
WHERE sname= '" 刘 佳 '); 


该 查询 首先 在 内 查询 中 找 出 刘 佳 同学 的 学 号 ,外 查询 再 根据 这 个 学 号 值 找 出 相应 的 
课程 号 。 但 是 ,如 果 学 生 中 叫 刘 佳 的 多 于 1 个 , 则 此 查询 就 是 错误 的 ,应 该 改 为 如 下 语句 。 


SELECT cno 
FROM sc 
WHERE sno IN 
(SELECT sno 
FROM student 
WHERE sname= '" 刘 佳 '); 


2) 用 IN 谓词 引导 子 查 询 

如 果子 查询 返回 的 值 是 多 个 时 ,就 只 能 用 IN ,而 不 能 用 = ,IN 后 面 接 的 是 集合 ,而 一 
后 面 是 一 个 具体 的 值 。 

【 例 9.64】 查询 选修 了 数据 库 这 门 课程 的 学 生 的 学 号 。 


SELECT sno 
EROM sc 
WHERE cno IN 
(SELECT cno 
FROM course 
WHERE cname= "数据库 ') ; 


在 该 查询 中 可 以 用 = 代替 IN, 因 为 课程 名 字 为 数据 库 的 只 有 一 门 。 
嵌 套 查询 允许 多 层 嵌 套 。 
【 例 9.65】 查询 选修 了 数据 库 这 门 课程 的 学 生 姓 名 。 


SELECT sname 
FROM student 
WHERE sno IN 
(SELECT sno 
FROM sc 
WHERE cno IN 
(SELECT cno 
FROM course 


WHERE cname= "数据 库 ') 
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3) 用 ANY、SOME 、ALL 引导 子 查询 


>RNY 大 于 子 查询 结果 中 的 某 个 值 
>ALL 大 于 子 查询 结果 中 的 所 有 值 
<ANY 小 于 子 查询 结果 中 的 某 个 值 
<ALL 小 于 子 查询 结果 中 的 所 有 值 
>=ANY 大 于 等 于 子 查 询 结 果 中 的 某 个 值 
>=ALL 大 于 等 于 子 查 询 结 果 中 的 所 有 值 
<=ANY 小 于 等 于 子 查 询 结 果 中 的 某 个 值 
<=ALL 小 于 等 于 子 查 询 结 果 中 的 所 有 值 
=ANY 等 于 子 查询 结果 中 的 某 个 值 
=ALL 等 于 子 查询 结果 中 的 所 有 值 
!=ANY 或 者 <>ANY 不 等 于 子 查 询 结 果 中 的 某 个 值 
!=ALL 或 者 <>ALL 不 等 于 子 查询 结果 中 的 任何 一 个 值 


【 例 9.66】 查询 非 database 系 中 , 比 database 系 任何 一 个 学 生年 龄 小 的 学 生 姓名 和 
年 龄 。 


SELECT sname, sage 
FROM student 
WHERE sage<ANY( 
SELECT sage 
FROM student 
WHERE sdept= 'database" 
) 
RND sdept< > 'database'; 


SELECT sname, sage 
FROM student 
WHERE sage< (SELECT MAX (sage) 
FROM student 
WHERE sdept= 'database" 
) 
RND sdept<> 'database'; 


【 例 9.67】〗 查询 非 database 系 中 , 比 database 系 所 有 学 生年 龄 小 的 学 生 姓名 和 
年 龄 。 


SELECT sname, Sage 
EROM student 
WHERE sage<ALL( 
SELECT sage 
FROM student 
WHERE sdept= "database" 
) 
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或 者 


RND sdept<> 'database'; 


SELECT sname, sage 
FROM student 
WHERE sage< ( 
SELECT MIN (sage) 
FROM student 
WHERE sdept= 'database" 
) 
RND sdept< > 'database'; 


2. 相关 的 其 套 查询 
相关 的 嵌 套 查询 是 指 内 查询 里 引用 了 外 查询 的 某 个 属性 ,其 执行 过 程 为 双 层 循环 的 


过 程 ,分 为 两 类 。 


(1) 不 带 exists 的 相关 典 套 查询 ,其 执行 过 程 如 下 。 

第 一 步 ; 把 外 查询 中 第 一 行 数据 中 被 引用 的 属性 值 传 人 内 查询 。 

第 二 步 ; 内 查询 根据 此 属性 值 计算 查询 结果 。 

第 三 步 ; 外 查询 根据 内 查询 的 结果 判断 第 一 行 数据 是 否 保留 ,满足 条 件 则 保留 在 查 


询 结果 中 ,和 否则 丢弃 。 


对 外 查询 的 每 行 数据 重复 执行 以 上 3 个 步骤 ,直到 外 查询 的 所 有 行 数 据 判断 完毕 。 
【 例 9.68】 查询 每 个 学 生 高 出 自己 所 有 科目 平均 成 绩 的 那些 课程 及 成 绩 。 


SELECT sno, cno, grade 
FROM sc s2 
WHERE grade > ( 
SELECT AVG (grade) 
FROM sc sl 
WHERE s1.sno= 52.sno 
); 
(2) 带 exists 的 相关 嵌 套 查询 ,其 执行 过 程 如 下 。 
第 一 步 : 把 外 查询 中 第 一 行 数据 中 被 引用 的 属性 值 传人 内 查询 。 
第 二 步 : 内 查询 根据 此 属性 值 计算 查询 结果 。 
第 三 步 : 外 查询 根据 内 查询 的 结果 判断 第 一 行 数据 是 否 保留 ,如 果 内 查询 有 结果 , 则 


返回 true 给 外 查询 ,外 查询 当前 行 数据 保留 在 结果 中 ,否则 返回 false 给 外 查询 ,外 查询 
当前 行 数据 丢弃 。 
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对 外 查询 的 每 行 数据 重复 执行 以 上 3 个 步骤 ,直到 外 查询 的 所 有 行 数据 判断 完毕 。 
【 例 9.69】 查询 选修 了 2 号 课程 的 学 生 的 姓名 。 


SELECT sname 
FROM student 


WHERE EXISTS ( 

SELECT 关 

FROM sc 

WHERE student.sno=sc.sno AND cno=2 
); 


【 例 9.70】 查询 没有 选修 2 号 课程 的 学 生 的 姓名 。 


SELECT sname 
FROM student 
WHERE NOT EXISTS ( 
SELECT * 
FROM sc 
WHERE student.sno=sc.sno RND cno=2 
); 


【 例 9.71】 查询 选修 了 全 部 课程 的 学 生 的 姓名 。 


SELECT sname 
FROM student 
WHERE NOT EXISTS 
(SELECT cno 
FROM course 
EXCEPT 
SELECT cno 
FROM sc 
WHERE sno= student .sno); 


【 例 9.72】 用 相关 肉 套 查询 数据 库 这 门 课程 的 直接 先 修 课程 。 


SELECT c2.cname 
FROM course cl,course c2 
WHERE cl1.cpno= c2.cno RND cl.cname= ' 数 据 库 '; 


以 上 自 连 接 可 改 为 如 下 相关 赃 套 查询 语句 。 


SELECT c2.cname 
FROM course c2 
WHERE EXISTS ( 
SELECT cl.* 
EROM course cl 
WHERE cl1.cpno= c2.cno AND cl.cname= ' 数 据 库 ' 
) 7 


9.3.4 集合 查询 





并 、 交 、 差 集合 运算 的 SQL 实现 分 别 采 用 关键 字 UNION INTERSECT EXCEPT， 
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实际 上 是 对 SQL 语句 的 查询 结果 进行 的 运算 。 有 些 RDBMS 不 一 定 支持 所 有 的 集合 运 
算 ,而且 采 用 的 关键 字 可 能 有 所 不 同 。 


1. 并 运算 
【 例 9.73】 查询 所 在 系 为 database 的 学 生 ,与 年 龄 小 于 20 岁 的 学 生 的 并 集 。 


SELECT student . 

FROM student 

WHERE sdept= 'database" 
UNION 

SELECT student.* 

FROM student 

WHERE sage< 20; 


该 SQL 语句 也 可 以 写成 如 下 形式 : 


SELECT student.* 
FROM student 
WHERE sdept= 'database' OR sage<=19; 


但 是 如 果 写 成 以 下 形式 ,该 语句 将 出 现 语法 错误 。 因 为 并 、 交 、 差 运算 要 求 两 个 SQL 


语句 的 结果 具有 相同 的 列 数 。 
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SELECT sno 

FROM student 
WHERE sdept= 'cs" 
UNION 

SELECT student . 
FROM student 
WHERE sage<=19; 


2. 交 运 算 
【 例 9.74】 查询 所 在 系 为 database 的 学 生 , 与 年 龄 小 于 20 岁 的 学 生 的 交集 。 


SELECT student.* 

FROM student 

WHERE sdept= 'database" 
INTERSECT 

SELECT student.* 

FROM student 

WHERE sage< 20; 


3. 差 运 算 
【 例 9.75】 查询 所 在 系 为 database 的 学 生 ,与 年 龄 小 于 20 岁 的 学 生 的 差 集 。 


关系 数据 库 标 准 语言 SQL 





SELECT student.* 

EROM student 

WHERE sdept= "database" 
EXCEPT 

SELECT student.* 

FROM student 

WHERE sage< 20; 


9.3.5 基于 派生 表 的 查询 


子 查询 不 仅 可 以 出 现在 WHERE 子 句 中 ,也 可 以 出 现在 SELECT 子 句 中 ,还 可 以 出 
现在 FROM 子 句 中 。 这 时 子 查询 生成 临时 的 派生 表 。 


1. 子 查询 出 现在 SELECT 子 句 中 
【 例 9.76】 查询 每 个 学 生 的 基本 信息 及 平均 成 绩 。 


SELECT student.*, 

( 
SELECT AVG (grade) 
FROM sc 
WHERE sno= student .sno 
GROUP BY sno 
)AS avg_grade 

FROM student; 


子 查询 的 结果 作为 SELECT 列表 中 的 属性 列 时 ,要 为 其 定义 别名 。 
2. 子 查询 出 现在 FROM 子 句 中 
【 例 9.77】 查询 学 生平 均 年 龄 在 20 岁 以 下 的 系 及 平均 年 龄 。 


SELECT * 
FROM (SELECT sdept,AVG (sage) 
FROM student 
GROUP BY sdept 
)AS s_age (sdept,avg age) 
WHERE avg_age< 20; 


当 子 查询 的 结果 作为 派生 表 时 ,需要 给 派生 表 定 义 表 名 和 列 名 。 


9.3.6 应 用 举例 


针对 公司 示例 数据 库 , 做 如 下 查询 。 
(1) 查询 5 号 部 门 工资 在 40000 以 下 的 男 员工 的 基本 信息 。 
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SELECT * 
FROM employee 
WHERE dno=5 AND salary< 40000 RND ssex= ' 男 '; 


(2) 查询 所 有 员工 的 地 址 。 
SELECT address 
FROM employee; 


(3) 查询 所 有 员工 的 姓名 及 地 址 。 


SELECT name, address 
FROM employee; 


(4) 查询 姓名 中 有 “ 思 ” 字 的 员工 信息 。 


SELECT * 
FROM employee 
WHERE name LIKE '$ 思 %"'; 


(5) 查询 不 姓 * 郑 ?的 员工 信息 。 


SELECT * 
FROM employee 
WHERE name NOT LIKE ' 郑 %'"7 


(6) 查询 每 个 部 门 员 工 的 人 数 。 


SELECT dno，COUNT (# ) 
FROM employee 
GROUP BY dno; 


(7) 查询 4 号 部 门 员工 的 平均 工资 。 


SELECT AVG (salary) 
FROM employee 
WHERE dno= 4; 


(8) 查询 部 门人 数 在 3 人 以 上 的 部 门 编号 。 
SELECT dno, COUNT (* ) 


FROM employee 
GROUP BY dno HAVING COUNT (* )>3; 


(9) 查询 其 顶头 上 司 为 333445555 的 那些 员工 的 信息 。 


SELECT * 
FROM employee 
WHERE superssn= '333445555"7 


(10) 查询 每 个 部 门 的 最 高 工资 。 


SELECT dno,MAX (salary) 
FROM employee 
GROUP BY dno; 


(11) 查询 女 员 工 的 信息 ,并 按 工资 升序 排序 。 


SELECT * 

FROM employee 
WHERE ssex= ' 女 ' 
ORDER BY salary; 


(12) 查询 “ 张 宏 " 所 在 的 部 门 名 。 


© seLEcT dname 
FROM employee e,department d 
WHERE e.dno=d.dnumber RND name= ' 张 宏 '; 


©@ sELECT dname 
FROM employee e INNER JOIN department d 
ON e.dno=d.dnumber 
WHERE name= ' 张 宏 '; 


© sELECT dname 
FROM department 
WHERE dnumber IN (select dno 
FROM employee 
WHERE name= ' 张 宏 '); 


(13) 查询 “行政 管理 ”部门 的 经 理 名 字 。 
同样 可 以 采取 多 种 方式 实现 该 查询 ,下 面 只 列 出 一 种 方法 。 


SELECT name 
FROM employee e,department d 
WHERE e.ssn=d.mgrssn AND dname= ' 行 政 管理 '; 


(14) 查询 工资 在 40000 以 下 的 那些 员工 所 在 的 部 门 名 字 。 


SELECT dname 
FROM employee e, department d 
WHERE e.dno=d.dnumber AND salary< 40000; 


(15) 查询 “ 李 丽 ” 的 顶头 上 司 的 名 字 。 


SELECT e2.name 
FROM employee el,enmployee e2 
WHERE el .superssn=e2.ssn AND el.name= ' 李 丽 '; 


(16) 查询 地 址 为 “长 沙 ” 的 部 门 信息 。 


SELECT dl.* 
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FROM department dl, dept locations d2 
WHERE dl.dnumber=d2.dnuniber RND dlocation= "长 沙 '; 


(17) 查询 “ 郑 敏 "参与 的 所 有 项 目 编号 。 


SELECT pno 
FROM employee e,works onw 
WHERE e.ssn=W.essn AND e.name= ' 郑 敏 '; 


(18) 查询 “ 郑 敏 " 参 与 的 所 有 项 目 信 息 。 


SELECT p. * 
FROM employee evworks_on w,project p 
WHERE e.ssn=w.essn RND w.pno=p.pnumber AND e.name= ' 郑 敏 '; 


(19) 查询 所 有 员工 及 其 所 在 的 部 门 名 。 


SELECT e. * ,dname 
FROM employee e, department d 
WHERE e.dno=d.dnumber; 


(20) 查询 所 有 的 部 门 信息 及 每 个 部 门 的 员工 信息 。 


SELECT qd. x ,e.* 
FROM department d LEFT OUTER JOIN employee e 
ON e.dno=d.dnunmber; 


(21) 查询 每 个 员工 在 所 参与 的 所 有 项 目 上 工作 的 总 时 间 。 


SELECT essn, SUM (hours) 
FROM works_on 
GROUP BY essn; 


(22) 查询 参与 项 目 数 在 3 个 及 3 个 以 上 的 员工 编号 。 


SELECT essn, COUNT (pno) 
FROM works_on 
GROUP BY essn HAVING COUNT (pno)>=3; 


(23) 查询 参与 项 目 数 在 3 个 及 3 个 以 上 的 员工 信息 。 


SELECT essn, COUNT (pno) 

FROM works_on, employee 

WHERE wroks_on.essn= employee.ssn 
GROUP BY essn HAVING COUNT (pno)>=3; 


(24) 查询 参与 了 2 号 项 目的 员工 信息 。 


SELECT employee. * 
FROM employee, works_on 
WHERE employee.ssn=works_on.essn AND pno=2; 
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(25) 查询 参与 了 所 有 项 目的 员工 信息 。 


SELECT employee.* 
FROM employee 
WHERE NOT EXISTS 
( 
SELECT pnumber 
FROM project 
EXCEPT 
SELECT pno 
FROM works_on 
WHERE essn= ssn 
); 


(26) 查询 没有 家 属 的 员工 信息 。 


SELECT * 

FROM employee 
WHERE ssn IN 
(SELECT ssn 
FROM employee 
EXCEPT 

SELECT essn 
FROM dependent) 7 


(27) 查询 员工 “ 王 湘 ”参与 的 项 目 名 。 


SELECT pname 
FROM employee e,works_on w,project p 
WHERE e.ssn=w.essn AND Ww.pno=p.pnumber AND name= ' 王 湘 '; 


(28) 查询 员工 “ 王 湘 ” 所 在 的 部 门 地 址 。 


SELECT dlocation 
FROM employee e, department dl, dept locations d2 
WHERE e.dno=d1 .dnumber AND d1.dnumber=d2.dnunber AND name= ' 王 湘 '; 


(29) 查询 “行政 管理 ”部 门 管理 了 哪些 项 目 。 


SELECT pnumber 
FROM department, project 
WHERE dname= "行政 管理 ' AND dnumber= dnum; 


(30) 查询 比 4 号 部 门 所 有 员工 工资 都 高 的 那些 员工 信息 。 


SELECT employee. * 

FROM employee 

WHERE salary > (SELECT MAX (salary) 
FROM employee 
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SELECT employee. * 

FROM employee 

WHERE salary > ALL (SELECT salary 
FROM employee 

WHERE dno= 4) 

RND dno< >4; 


9.4 数据 更 新 


数据 更 新 操作 包含 3 种 : 向 表 中 添加 若干 行 数据 (插入 数据 ) ,修改 表 中 的 数据 (修改 
数据 ) 、 删 除 表 中 若干 行 数据 (删除 数据 )。 


9.4.1 插入 数据 


SQL 语句 中 ,向 表 中 搬入 数据 的 关键 字 为 INSERT, 可 以 一 次 向 表 中 插入 单行 (元 
组 ) 数 据 , 也 可 以 一 次 向 表 中 插入 多 行 ( 元 组 ) 数 据 。 


1. 插入 单行 数据 
搬入 单行 数据 的 格式 为 


INSERT INTO < 表 名 > [(< 属 性 列 1> [,< 属 性 列 2> ]…)] 

VALUES (< 值 1> [,< 值 2>]…) 7 

该 语句 的 功能 是 对 指定 的 表 插入 一 行 新 的 数据 ,属性 列 1 的 值 对 应 值 1, 属 性 列 2 的 
值 对 应 值 2…… 如 果 不 指 定 任何 列 名 , 则 表示 按 顺序 对 指定 表 的 所 有 属性 列 都 插入 对 应 
的 值 。 

【 例 9.78】 向 学 生 表 student 插入 一 个 新 学 生 的 信息 。 


INSERT INTO student 
VALUES ('160610106', ' 周 圆 圆 ', ' 女 ',20, 'computer'); 


该 语句 向 学 生 表 插 入 数据 时 没有 指定 列 名 ,表示 按 顺 序 对 学 生 表 的 每 个 属性 列 都 插 
入 值 ,其 属性 列 的 顺序 与 建立 学 生 表 时 的 顺序 一 致 ,插入 值 的 数据 类 型 必须 对 应 属性 列 定 
义 的 数据 类 型 。 如 果 插 入 的 是 字符 串 类 型 的 数据 , 则 需要 用 单 引号 括 起 来 。 

【 例 9.79】 向 学 生 表 student 插入 一 个 新 学 生 的 部 分 信息 。 


INSERT INTO student (sname, sage, sno) 
VALUES (" 孙 斌 ',19, '160610107'); 
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该 语句 指定 了 要 插入 的 属性 列 名 。 该 新 生 的 姓名 为 孙 斌 ,年 龄 为 19 岁 ,学 号 为 
160610107。 值 的 顺序 与 属性 列 的 顺序 一 致 ,而 不 是 创建 表 时 的 顺序 。 对 于 学 生 表 中 未 列 
出 的 属性 ,自动 赋 空 值 ,如 孙 斌 的 性 别 和 系 都 为 空 值 。 


2. 插入 多 行 数据 
对 指定 表 一 次 插入 多 行 数据 ,一 般 是 插入 子 查询 的 结果 。 其 语句 格式 如 下 : 


INSERT 
INTO < 表 名 > [(< 属 性 列 1> [,< 属 性 列 2>…] 
子 查询 ; 
【 例 9.80】 创建 一 个 表 student2, 其 结构 和 学 生 表 student 一 致 ,然后 将 学 生 表 
student 中 的 数据 全 部 插入 student2 表 中 。 


INSERT INTO student2 
SELECT * FROM student; 


【 例 9.81】 创建 一 个 新 表 student3 ,用 来 存放 所 有 学 生 的 姓名 及 所 在 系 名 。 


CREATE TABLE student3 
( 

sname CHAR (20), 

sdept CHAR(50) 

) 


向 表 student3 插入 数据 。 


INSERT 

INTO student3 (sname, sdept) 
SELECT sname, sdept 

FROM student; 


9.4.2 修改 数据 


修改 操作 又 称 为 更 新 操作 ,其 关键 字 为 UPDATE, 其 语法 格式 为 


UPDATE< 表 名 > 
SET < 列 名 >=< 表 达 式 > [,< 列 名 >=< 表 达 式 >]… 
[WHERE< 条 件 > ]; 


根据 WHERE 子 句 中 给 出 的 条 件 修改 指定 行 中 指定 列 的 值 。 当 没有 WHERE 子 句 
时 ,表示 修改 指定 表 的 所 有 行 的 指定 列 的 数据 。 


1. 修改 若干 行 数据 
【 例 9.82】 将 所 有 学 生 的 所 在 系 改 为 physics。 
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UPDATE student 
SET sdept= 'physics'7 


【 例 9. 83】 将 学 号 为 160610101 学 生 的 年 龄 改 为 18 。 


UPDATE student 
SET sage=18 
WHERE sno= "160610101"; 


【 例 9.84】 将 database 系 的 所 有 学 生 的 年 龄 加 1。 


UPDATE student 
SET sage= sage+ 1 
WHERE sdept= 'database'; 


2. 带子 查询 的 修改 语句 


类 似 地 ,可 以 在 修改 语句 的 WHERE 子 名 中风 套子 查询 ,用 来 设置 修改 条 件 。 


【 例 9.85】 将 所 有 女 学 生 的 成 绩 加 5 分 。 


UPDATE sc 
SET grade=grade+ 5 
WHERE sno IN 
( 
SELECT sno 
FROM student 
WHERE ssex= ' 女 ' 


9.4.3 删除 数据 


删除 数据 的 关键 字 为 DELETE, 其 语法 格式 如 下 。 


DELETE 
FROM< 表 名 > 
[WHERE< 条 件 >]; 


该 语句 的 功能 是 删除 指定 表 中 满足 WHERE 子 句 条 件 的 行 


句 , 则 表示 删除 指定 表 中 的 所 有 行 。 
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1. 删除 若干 元 组 
【 例 9.86】 删除 * 刘 佳 ? 的 信息 。 


DELETE 
FROM student 
WHERE sname= " 刘 佳 '; 


。 如 果 不 带 WHERE 子 





【 例 9.87】 删除 全 体 学 生 的 信息 。 
DELETE FROM student; 
【 例 9.88】 删除 physics 系 年 龄 在 30 岁 以 上 的 学 生 信息 。 


DELETE 
EROM student 
WHERE sdept= "physics' RND sage> 30; 


2. 带子 查询 的 删除 语句 


同样 ,也 可 以 在 删除 语句 的 WHERE 子 句 中 谱 套 子 查询 ,用 以 设置 删除 的 条 件 。 
【 例 9.89】 删除 所 有 数据 库 的 选课 记录 。 


DELETE 
FROM sc 
WHERE cno= 
(SELECT cno 
FROM course 
WHERE cname= ' 数 据 库 ' 


9.4.4 应 用 举例 


(1) 向 employee 表 插 入 一 个 新 的 员工 。 


INSERT INTO employee 
VALUES (" 李 锡 '，'147258369'，'1983- 01- 24',' 上 海 ', ' 男 '，60000,'987987987', 1); 


(2) 向 employee 表 插 入 一 个 新 的 员工 ( 周 圆 圆 ,345345345 ,北京 , 女 )。 
INSERT INTO employee (name, ssn,address, ssex) 

VALUES (" 周 圆 圆 '，'345345345'，" 北 京 "，'" 女 )7 

(3) 把 所 有 员工 的 每 个 项 目 参与 时 间 加 2 个 小 时 。 


UPDATE works_on 
SET hours=hours+ 2; 


(4) 把 员工 “ 王 安 " 参 与 的 所 有 项 目 时 间 加 1 个 小 时 。 


UPDATE works_on 

SET hours=hours+1 

WHERE essn= ( 
SELECT ssn 
FROM employee 
WHERE name= ' 王 安 ' 
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); 
(5) 删除 员工 “ 郑 敏 " 的 项 目 参与 记录 。 


DELETE 
FROM works_on 
WHERE essn= ( 
SELECT ssn 
FROM employee 
WHERE name= ' 郑 敏 ' 
); 
(6) 删除 所 有 家 属 的 信息 。 


DELETE FROM dependent; 


9.5 视图 


所 有 的 数据 库 管理 系统 基本 都 提供 了 视图 ,视图 是 从 一 个 或 者 几 个 表 ( 视 图 ) 导 出 的 
表 , 它 是 虚拟 的 表 , 在 DBMS 中 ,只 保存 视图 的 定义 ,视图 中 的 数据 仍然 保存 于 基 表 中 。 
因此 ,一 旦 基 表 中 的 数据 发 生变 化 ,视图 中 查询 出 的 数据 也 跟着 变化 ,视图 就 像 一 个 窗口 ， 
透 过 它 可 以 看 到 数据 库 中 自己 感 兴趣 的 数据 及 其 变化 。 

视图 一 经 定义 ,就 可 以 像 操作 表 一 样 操作 它 。 可 以 像 查 询 表 一 样 查询 视图 中 的 数据 ， 
其 操作 语法 与 表 相 同 。 但 是 ,对 视图 进行 插入 、 删 除 、 修 改 数据 则 受到 一 定 的 限制 。 


9.5.1 定义 视图 


1. 创建 视图 
在 SQL 中 创建 视图 的 关键 字 为 CREATE VIEW ,其 一 般 格式 为 


CREATE VIEW < 视图 名 > [(< 列 名 1> [,< 列 名 2>]*…)] 
AS< 子 查询 > 
[WITH CHECK OPTION]; 


其 中 的 列 名 是 指 创建 的 视图 的 列 名 。 视 图 的 列 名 要 么 都 指定 ,要 么 都 不 指定 。 如 果 都 不 
指定 , 则 视图 中 的 列 名 与 子 查询 中 的 目标 列 名 相同 。 但 出 现下 面 情况 时 ,所 创建 视图 的 列 
名 必须 指定 。 

(1) 视图 中 目标 列 不 是 单纯 属性 ,而 是 来 自 表 达 式 .函数 。 

(2) 查询 子 句 基于 多 个 表 , 不 同 表 中 具有 相同 的 列 名 ,并 且 这 些 列 名 出 现在 视图 中 。 

(3) 需要 为 视图 中 某 个 列 启用 新 的 更 合适 的 名 字 。 

子 查询 语句 是 一 个 定义 视图 的 SELECT 语句 ,可 以 是 任何 合法 的 查询 语句 ,但 是 不 
同 的 DBMS 对 子 查询 是 否 允 许 含有 ORDER BY 子 句 和 DISTINCT 短语 有 不 同 的 规定 。 
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WITH CHECK OPTION 选项 表示 对 视图 进行 修改 .插入 和 删除 操作 时 ,元 组 必须 


满足 子 查询 中 WHERE 子 句 设置 的 条 件 。 


创建 视图 分 为 以 下 几 类 。 
1) 在 单 表 上 建立 视图 
【 例 9.90】 建立 computer 系 学 生 的 视图 。 


CREATE VIEW v_com student 
RS 

SELECT * 

EROM student 

WHERE sdept= "computer "7 


可 以 在 该 视图 上 进行 任意 的 增 、 删 、 改 、 查 操作 ,也 可 以 插入 非 computer 系 的 学 生 。 


但 是 ,在 上 面 的 定义 语句 上 添加 WITH CHECK OPTION 之 后 ,该 视图 只 允许 插入 
computer 系 的 学 生 , 而 且 修 改 之 后 的 数据 也 必须 是 computer 系 的 学 生 。 该 视图 包含 了 
student 表 的 所 有 列 。 


2) 在 多 表 上 建立 视图 
【 例 9.91】 建立 computer 系 学 生 选 课 情况 视图 。 


CREATE VIEW v_com grade (sno, sname sage, grade) 
RS 

SELECT student .sno, sname, sage, grade 

FROM student, sc 

WHERE student.sno= sc.sno AND sdept= 'computer'; 


必须 为 该 视图 指定 列 名 ,因为 视图 中 包含 的 学 号 同时 存在 于 student 表 和 sc 表 中 。 
3) 建立 带 取 集 函数 或 者 表达 式 的 视图 
【 例 9.92】 为 每 个 系 的 学 生 及 其 平均 年 龄 建立 视图 。 


CREATE VIEW Vv_avg_age (sdept,avg_age) 
RS 

SELECT sdept,avg(age) 

FROM student 

GROUP BY sdept; 


必须 指定 该 视图 的 列 名 ,因为 在 子 查询 的 目标 列 中 使 用 了 聚集 函数 。 无 法 对 该 视图 


进行 插入 数据 更 新 数据 及 删除 数据 操作 ,只 能 查询 该 视图 。 


【 例 9.93】 定义 一 个 反映 学 生出 生年 份 的 视图 。 


CREATE VIEW V_ birth (sno, sname, birthday) 
RS 

SELECT sno, sname, 2017- sage 

FROM student; 


必须 指定 该 视图 的 列 名 ,因为 在 子 查询 的 目标 列 中 使 用 了 表达 式 。 无 法 对 该 视图 进 
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行 插入 数据 ,更 新 数据 操作 。 


2. 修改 视图 
修改 视图 实际 上 就 是 修改 视图 的 定义 ,用 新 的 子 查询 代替 原来 视图 定义 中 的 子 查询 。 


其 语法 如 下 : 


ALTER VIEW < 视图 名 > 
RS < 子 查 询 语句 >; 


【 例 9.94】 把 例 9. 90 定义 的 computer 系 学 生 的 视图 改 为 network 系 学 生 的 视图 。 


ALTER VIEW v_com student 
RS 

SELECT * 

FROM student 

WHERE sdept= 'network'7 


3. 删除 视图 

其 语法 格式 为 

DROP VIEW < 视图 名 >; 

【 例 9.95】 删除 视图 v_birth。 
DROP VIEW v_birth; 


删除 视图 只 是 删除 视图 的 定义 ,其 中 的 数据 仍然 在 基 表 中 。 


9.5.2 查询 视图 


用 户 可 以 像 查 询 基 本 表 一 样 查询 视图 ,其 语法 格式 一 样 。 
【 例 9.96】 在 computer 系 学 生 的 视图 中 找 出 所 有 女 学 生 的 信息 。 
SELECT * 


FROM Vv_com student 
WHERE ssex= ' 女 '; 


实际 上 ,对 视图 的 查询 都 转换 为 对 基 表 的 查询 , 它 把 视图 定义 和 用 户 查 询 结 合 起 来 ， 


转换 为 对 基 表 的 查询 。 因 此 ,这 个 查询 转化 为 
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SELECT * 
FROM student 
WHERE sdept= 'computer' AND ssex=' 女 '; 


【 例 9.97】 在 v_avg_age 视图 中 ,查询 平均 年 龄 在 20 岁 以 下 的 系 和 平均 年 龄 。 


SELECT 关 
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FROM V_ avg age 
WHERE avg age<207 


将 本 例 中 的 查询 语句 与 定义 v_avg_age 视图 的 子 查询 相 结合 ,转化 为 对 基 表 的 查询 。 


9.5.3 更 新 视图 


由 于 视图 的 数据 来 自 基 表 ,因此 对 视图 的 更 新 (插入 、 删 除 ,修改 ) 操 作 , 最 终 转换 为 对 
基 表 数据 的 更 新 。 


1. 插入 
【 例 9.98】 向 computer 系 学 生 视 图 v_com_student 中 插入 一 个 新 的 学 生 信息 。 


INSERT 
INTO v_com student 
VALUES ('160610107'，' 何 敏 ',，' 男 ',，20,'computer'); 


实际 上 , 它 将 转换 为 对 基 表 的 插入 操作 。 


INSERT 
INTO student 
VALUES ('160610107'，' 何 敏 ',，' 男 ',，20,'computer'); 


2. 修改 


【 例 9.99】 将 computer 系 学 生 视图 v_com_student 中 学 号 为 160610103 的 学 生 姓 
名 改 为 张 雷 。 
UPDATE Vv_com student 


SET sname= ' 张 雷 ' 
WHERE sno= "160610103'; 


类 似 地 , 它 将 转换 为 对 基 表 的 修改 操作 。 


UPDATE student 
SET sname= ' 张 雷 ' 
WHERE sno= "160610103'; 


3. 删除 


【 例 9.100】 删除 computer 系 学 生 视图 v_com_student 中 学 号 为 160610103 的 学 生 
信息 。 
DELETE 


FROM Vv_com student 
WHERE sno= "160610103"7 
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同样 ,转换 为 对 基 表 的 删除 操作 。 


DELETE 
FROM student 
WHERE sno= "160610103"; 


对 前 面 建立 的 每 个 系 的 学 生 及 其 平均 年 龄 视图 v_avg_age 进行 插入 、 删 除 、 修 改 数据 


的 操作 ,发 现 这 些 操作 都 无 法 进行 。 


因此 ,并 不 是 所 有 视图 都 可 以 进行 更 新 ,只 有 简单 视图 才 可 以 。 

目前 ,市 场 上 的 DBMS 对 视图 的 更 新 操作 有 不 同 的 规定 。 

例如 ,DB2 规定 : 

(1) 如 果 视 图 是 在 几 个 表 上 建立 的 , 则 此 视图 不 允许 更 新 。 

(2) 若 视图 的 字段 由 表达 式 或 者 常数 组 成 , 则 只 能 进行 DELETE 操作 。 

(3) 若 视图 的 字段 由 聚集 函数 构成 , 则 不 允许 更 新 。 

(4) 若 视图 定义 中 含有 GROUP BY 子 句 .DISTINCT 短语 , 则 此 视图 不 允许 更 新 。 


9.5.4 视图 的 优点 


使 用 视图 有 以 下 几 个 优点 。 
(1) 可 以 简化 用 户 的 操作 。 
通过 定义 视图 使 得 查询 更 加 简单 , 当 一 个 查询 涉及 几 个 表 时 ,视图 可 以 将 几 个 表 的 连 


接 操作 隐藏 起 来 。 这 样 ,用户 只 对 一 个 虚 表 做 简单 的 查询 操作 即 可 。 
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【 例 9.101】 查询 “ 刘 佳 "所 选 的 所 有 课 及 其 成 绩 。 


SELECT student.*% ,sc.* ,COUrse.* 
FROM student, sc, course 


WHERE student.sno= sc.sno RND sc.cno=course.cno RND sname= ' 刘 佳 '; 
但 是 如 果 在 这 3 个 表 上 建立 视图 ， 


CREATE VIEW s_c_grade (sno, sname, cno, cname, grade) 
RS 

SELECT student .sno, sname, sc.cno, course.cname,grade 
FROM student, sc, course 


WHERE student.sno= sc.sno RND sc.cno=course.cno; 
查询 “ 刘 佳 ”的 成 绩 就 变 为 

SELECT * FROM s c grade WHERE sname=' 刘 佳 '; 

这 个 查询 较 之 前 的 查询 简单 了 。 

(2) 视图 可 以 使 用 户 以 多 种 角度 看 待 同一 数据 。 


在 同一 个 数据 库 上 可 以 为 多 个 不 同 的 用 户 从 不 同 的 角度 定义 视图 。 
例如 ,在 学 校 里 面 ,有 人 关注 学 生成 绩 , 有 人 关注 学 生 是 否 缴 费 , 有 人 关注 学 生 心理 是 
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和 否 健康 ,有 人 关注 学 生 宿舍 分 配 等 。 

(3) 视图 可 以 提供 数据 的 迎 辑 独立 性 。 

在 数据 库 的 三 级 模式 结构 中 ,视图 属于 外 模式 , 当 模 式 发 生变 化 时 ,可 以 不 修改 数据 
库 应 用 程序 ,只 修改 视图 定义 ,从 而 保证 数据 的 逻辑 独立 性 。 

【 例 9.102】 将 学 生 关 系 student(sno,sname,ssex,sage,sdept) 分 为 sl(sno,sname， 
sage) 和 s2(sno,ssex,sdept) 两 个 关系 。 这 时 原 表 为 sl 和 s2 的 自然 连接 结果 。 如 果 建 立 
一 个 视图 student: 


CREATE VIEW student (sno, sname, ssex, sage, sdept) 
RS SELECT s1.sno, sname, sage, ssex, sdept 

FROM sl1, s2 

WHERE sl1.sno= s2.sno; 


这 样 ,尽管 数据 库 的 逻辑 结构 发 生 了 改变 ,但 应 用 程序 仍然 可 以 不 用 修改 ,因为 新 建 
立 的 视图 定义 为 用 户 原 来 的 关系 ,使 得 用 户 的 外 模式 不 发 生变 化 ,应 用 程序 仍然 可 以 通过 
视图 查找 到 原来 的 数据 。 

(4) 视图 能 够 提高 数据 的 安全 性 。 

为 不 同 的 用 户 建立 不 同 的 视图 ,可 以 对 不 必要 的 用 户 屏蔽 敏感 数据 ,并 且 视 图 中 数据 
的 更 新 \ 删 除 ` 插 入 操作 是 有 限制 条 件 的 。 

例如 ,对 于 学 生 课 程 数 据 库 , 可 以 为 教师 用 户 建立 视图 , 既 可 以 查询 学 生 的 基本 信息 ， 
又 可 以 查询 自己 教授 课程 的 学 生 的 成 绩 信息 ;而 为 学 生 用 户 建立 的 视图 除了 可 以 查看 学 
生 的 基本 信息 之 外 ,只 能 查看 自己 的 成 绩 。 


9.5.5 应 用 举例 


对 公司 数据 库 建 立 合适 的 视图 ,并 进行 更 新 操作 。 
(1) 为 每 个 部 门 及 其 平均 工资 建立 视图 。 


CREATE VIEW Vv_dep_salary (dno, dname,avg_salary) 
RS 

SELECT employee.dno, dname, AVG (salary) 

FROM department, employee 

WHERE department .dnumber= employee .dno 

GROUP BY department .dnumber; 


(2) 为 参与 项 目的 员工 及 其 在 所 有 项 目 上 的 总 工作 时 间 建 立 视图 。 


CREATE VIEW Vv_pro_hours (ssn, sum hours) 
RS 

SELECT essn, sum (hours) 

FROM works_on 

GROUP BY essn; 
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(3) 给 关系 为 配偶 的 家 属 建立 视图 。 


CREATE VIEW v_dependent (ssn,d name,dsex) 
RS 

SELECT essnvdependent name,ssex 

FROM dependent 

WHERE relationship= "配偶 


(4) 查询 部 门 平均 工资 在 40000 以 上 的 部 门 编号 。 


SELECT dno 
FROM V_dep _ salary 
WHERE avg_ salary> 40000; 


(5) 查询 部 门 平 均 工 资 在 40000 以 上 的 部 门 编号 .部门 名 及 部 门 经 理 。 


SELECT dno, dname, mgrssn 
FROM v_dep_salary v,department d 
WHERE v.dno=d.dnumber AND avg_salary> 40000; 


9.6 索引 


索引 是 RDBMS 的 内 部 实现 技术 ,属于 内 模式 范畴 。 目 前 ,在 SQL 的 标准 中 没有 涉 
及 索引 ,但 是 在 市 场 上 的 数据 库 管理 系统 一 般 都 支持 索引 。 

如 果 一 个 表 中 包含 的 数据 量 比较 大 时 ,查询 会 非常 耗 时 ,通过 建立 索引 可 以 加 快 查询 
速度 。 

当 查 询 某 本 书 中 的 某 个 知识 点 时 ,如 果 通 过 一 页 一 页 翻 一 行 一 行 查找 ,速度 会 非常 
慢 , 但 是 如 果 首 先 查 找 目录 (目录 实际 上 就 是 书 的 索引 ) ,再 找 对 应 知识 点 所 在 的 页 ,就 可 
快速 找到 要 查找 的 内 容 。 同 样 ,如 果 对 表 中 的 数据 查询 ,一 行 一 行 查找 扫描 ,效率 也 会 非 
常 低 下 ,但 是 对 表 建 立 相 应 的 目录 ( 即 索引 ) ,通过 首先 查找 目录 获取 地 址 ,再 根据 地 址 查 
找 相应 的 数据 ,速度 将 会 大 大 提高 。 

书 的 目录 由 主题 及 主题 对 应 的 页 码 构成 ,类 似 地 ,索引 可 以 看 成 是 键 - 值 对 ,其 中 的 键 
为 属性 , 值 为 地 址 ,实际 上 索引 就 是 属性 - 值 对 。 在 某 个 属性 上 建立 索引 ,可 以 查找 到 该 属 
性 值 对 应 的 地 址 。 

例如 ,学 生 表 中 有 10 万 条 学 生 数 据 ,如 果 要 查找 “数学 系 ”的 学 生 , 就 需要 对 学 生 表 进 
行 整 表 扫描 。 而 如 果 在 学 生 表 的 “所 在 系 " 上 建立 了 索引 ,那么 就 可 以 直接 根据 “数学 系 ” 
找到 相应 数据 存放 的 地 址 ,再 根据 地 址 获取 数学 系 的 学 生 ,这 样 速度 就 会 大 大 提高 。 

但 是 ,索引 是 数据 库 中 额外 创建 的 对 象 , 需 要 占用 一 定 的 存储 空间 ,对 数据 的 更 新 操 
作 , 必 然 引起 对 索引 的 维护 ,加 重 数据 库 的 负担 ,加 大 系统 开销 ,从 而 影响 系统 性 能 。 因 
此 , 当 系 统 中 查询 操作 比较 多 时 可 以 考虑 建立 索引 ,而 当 更 新 操作 比较 多 时 则 需 慎重 考虑 
是 否 创建 索引 。 

索引 有 很 多 分 类 ,包括 唯一 索引 、 聚 秘 索 引 等 ,不 同 生 产 厂 家 的 RDBMS 支持 的 索引 
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类 型 不 同 ,实现 技术 也 不 相同 。 
1. 创建 索引 
创建 索引 的 关键 字 为 CREATE INDEX ,其 语法 格式 为 


CREATE [UNIQUE] [CLUSTER] INDEX< 索 引 名 > 

ON< 表 名 > (< 列 名 > [次 序 ] [,< 列 名 > [< 次 序 >]]*…); 

索引 可 以 建立 在 一 列 上 或 多 列 上 , 列 之 间 用 逗号 分 隔 , 每 个 列 后 还 可 以 用 ASC 或 
DESC 指定 升序 或 者 降序 ,默认 为 升序 (ASC)。 

关键 字 UNIQUE 表示 建立 唯一 索引 ,表示 每 个 索引 值 只 对 应 唯一 的 数据 记录 。 

关键 字 CLUSTER 表示 建立 聚焦 索引 ,表示 记录 的 索引 顺序 与 其 物理 顺序 相同 , 因 
此 ,一 个 关系 只 能 建立 一 个 聚 秘 索 引 , 聚 簇 索引 也 可 称 为 聚集 索引 。 

【 例 9.103】 在 学 生 表 的 所 在 系 上 创建 索引 。 


CREATE INDEX index_ sdept 
ON student .sdept ASC; 


2. 删除 索引 
删除 索引 后 ,系统 自动 回收 索引 占用 的 空间 。 删 除 索引 的 格式 为 


DROP INDEX < 索引 名 >; 
【 例 9.104】 将 创建 的 index_sdept 删除 。 


DROP INDEX index sdept; 


9.7 其 他 的 相关 理论 


1. 数据 字典 


数据 字典 是 RDBMS 中 的 一 组 系统 表 , 记 录 了 数据 库 中 所 有 的 定义 信息 ,包括 关系 定 
义 、 视 图 定义 、 索 引 定义 、 完 整 性 定义 、 用 户 操作 权限 定义 、 其 他 的 数据 库 对 象 定义 以 及 统 
计 信 息 等 。 在 RDBMS 中 执行 SQL 定义 语句 时 ,实际 上 就 是 更 新 数据 字典 系统 表 中 的 相 
应 信息 。 进 行 查询 优化 和 查询 处 理 时 ,必须 访问 数据 字典 系统 表 里 的 信息 。 


2. 查询 表 的 执行 过 程 


RDBMS 执行 对 表 查 询 时 ,首先 进行 查询 分 析 , 判 断 是 否 存在 语法 错误 ,接着 对 没有 
语法 错误 的 查询 语句 进行 语义 检查 ,检查 语句 中 的 关系 名 、 属 性 名 是 否 存 在 以 及 是 否 有 
效 , 并 根据 数据 字典 中 的 用 户 权 限 和 完整 性 约束 进行 检查 ,如 果 有 相应 的 权限 , 则 转换 成 
内 部 表示 , 即 转换 为 等 价 的 关系 代数 表达 式 。 每 个 查询 的 执行 会 有 多 种 策略 和 算法 ,选择 
最 高 效 的 策略 执行 查询 ,最 后 送 回 结果 。 
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3. 查询 视图 的 执行 过 程 


RDBMS 执行 对 视图 查询 时 ,首先 进行 语法 及 有 效 性 检查 ,检查 查询 中 涉及 的 视图 、 
表 是 否 存在 。 如 果 存 在 , 则 从 数据 字典 中 提取 视图 的 定义 ,把 定义 中 的 查询 语句 和 用 户 的 
查询 语句 结合 起 来 ,转化 为 对 基 表 的 查询 ,这 一 过 程 叫 作 视图 的 消解 。 


4. 带 索引 查询 的 执行 过 程 


每 个 查询 的 执行 会 有 多 种 策略 和 算法 ,例如 ,简单 的 全 表 扫描 算法 、 索 引 扫描 算法 等 。 
查询 优化 器 会 根据 优化 策略 选择 存在 的 合适 的 索引 扫描 算法 完成 查询 。 


9.8 小 结 


本 章 首先 详细 介绍 了 SQL 标准 中 的 DDL 语句 .DQL 语句 .DML 语句 ,用 DDL 语句 
创建 关系 模式 、 视 图 ,索引 完整 性 约束 ,修改 关系 模式 视图、 完整 性 约束 。DQL 语句 只 
包含 SELECT 关键 字 , 详 细 曾 述 了 单 表 查询 ,多 表 查 询 . 嵌 套 查询 、 集 合 查询 的 写法 及 应 
用 ,其 次 详细 说 明了 对 数据 的 INSERT、DELETE、UPDATE 操作 ,最 后 探讨 了 视图 对 象 
的 用 法 ,研究 了 索引 的 使 用 。 每 一 部 分 内 容 都 给 出 了 公司 数据 库 的 综合 运用 举例 。 


9.9 习题 


. 什么 是 基本 表 ? 什么 是 视图 ?两 者 的 区 别 是 什么 ? 

. 是 不 是 所 有 的 视图 都 可 以 更 新 ?哪些 视图 可 以 更 新 ? 哪些 视图 不 可 以 更 新 ? 
.视图 的 优点 是 什么 ? 

. 图 书 管理 系统 数据 库 包含 如 下 关系 : 

图 书 (ISBN, 图 书 名 字 ,价格 ,出 版 社 ,类 型 ,存量 ) 

读者 (读者 ID, 读 者 名 字 , 学 号 ,专业 ) 

借阅 (ISBN, 读 者 ID, 借 阅 日 期 ) 

试 做 以 下 查询 : 

(1) 查询 ( 颜 氏 家 训 ) 的 ISBN 存量、 价格 。 

(2) 查询 讲述 数据 库 相 关 知识 的 图 书 。 

(3) 查询 借阅 了 ( 颜 氏 家 训 ) 的 读者 ID。 

(4) 查询 借阅 了 《 颜 氏 家 训 ) 的 读者 名 字 。 

(5) 查询 “计算 机 科学 与 技术 ”专业 借阅 了 《 颜 氏 家 训 ) 的 读者 ID。 

(6) 查询 “计算 机 科学 与 技术 ”专业 借阅 了 ( 颜 氏 家 训 ) 的 读者 名 字 。 

(7) 查询 “计算 机 科学 与 技术 ”专业 借阅 了 “古典 文学 ”类 型 的 读者 ID。 
(8) 查询 “计算 机 科学 与 技术 ”专业 借阅 了 “古典 文学 "类 型 的 读者 名 字 。 


上 上 性 
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前 面 的 章节 主要 是 关注 数据 库 的 定义 ,数据库 对 象 的 增 、 删 \ 改 、 查 ,大 多 数 的 数据 库 
管理 系统 都 提供 了 一 个 交互 接口 ,执行 SQL 命令 进行 交互 ,如 Oracle 中 通过 在 SQL 
PLus 中 输入 命令 进行 交互 ,SQL Server 中 通过 在 查询 编辑 器 中 输入 命令 进行 交互 。 本 
章 的 数据 库 编程 主要 介绍 应 用 程序 或 者 数据 库 应 用 程序 访问 数据 库 。 这 些 应 用 程序 主要 
提供 给 终端 用 户 使 用 ,如 学 生 管 理 系 统 、 机 票 预订 系统 、 酒 店 管理 系统 、 鲜 花 在 线 销售 系 
统 、 手 机 在 线 销售 系统 等 都 是 这 样 的 数据 库 应 用 程序 。 可 以 通过 机 票 预 订 系统 预订 机 票 ， 
通过 手机 在 线 销 售 系统 购买 手机 。 


10.1 编程 介绍 


数据 库 编程 技术 主要 包括 以 下 3 个 方面 。 

(1) 嵌入 式 SQL(Embedded SQL) ,这 种 方式 主要 通过 将 SQL 语句 嵌入 到 宿主 语言 
(如 C 语言 等 其 他 开发 语言 ) 中 。 在 嵌入 式 SQL 中 ,所 有 的 SQL 语句 都 必须 加 上 前 级 ,如 
宿主 语言 为 C 语言 时 ,用 EXEC SQL 表示 前 级 。 预 编译 处 理 程序 对 源 程序 进行 扫 措 , 识 
别 出 戏 入 式 SQL 语句 ,把 它们 转换 成 宿主 语言 的 调用 语句 ,以 使 主语 言 编译 程序 能 识别 
它们 ,然后 再 编译 成 目标 程序 。 

(2) 数据 库 编程 语言 ,除了 进行 增删 . 改 . 查 等 SQL 命令 ,还 增加 了 常量 变量 ,扩充 
了 数据 类 型 ,增加 了 循环 条件 分 支 等 结构 ,实现 了 数据 库 的 模块 化 程序 , 它 既 有 实现 数据 
库 的 命令 操作 功能 ,又 有 实现 业务 处 理 能 力 , 这 些 模 块 化 的 程序 可 以 永久 保存 在 数据 库 
中 ,如 SQL Server 的 T-SQL 编程 .Oracle 的 PL/SQL 编程 等 。 

(3) 应 用 编程 接口 (Application Programming Interface，API) ,一 般 的 开发 语言 中 都 
包含 一 些 专门 处 理 数据 库 的 函数 ,程序 开发 语言 通过 这 些 函 数 可 以 与 数据 库 进 行 连接 , 执 
行 增 、 删 \ 改 、 查 等 SQL 命令 ,通过 这 些 API 函数 访问 数据 库 。 

在 本 章 中 ,10. 2 节 介绍 嵌入 式 SQL; 10. 3 节 介绍 数据 库 编程 语言 ;10. 4 节 介绍 
ADO. NET 编程 和 JDBC 编程 。 





10.2 说 入 式 SQL 


SQL 有 两 种 形式 : 一 种 是 自主 式 SQL, 即 SQL 作为 独立 的 数据 语言 ,以 交互 方式 使 
用 ; 另 一 种 是 嵌入 式 SQL(Embedded SQL), 即 SQL 嵌入 到 其 他 高 级 语言 中 ,在 其 他 高 级 
语言 中 使 用 。 被 嵌入 的 高 级 语言 (如 C/C++ .Ada、COBOL、Java 等) 称 为 宿主 语言 (或 主 
语言 ) 。 

将 SQL 嵌入 到 高 级 语言 中 使 用 , 既 可 以 使 SQL 借助 高 级 语言 来 实现 本 身 难以 实现 
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的 复杂 的 业务 操作 问题 ,如 与 用 户 交 互 、 图 形 化 显示 、 复 杂 数 据 的 计算 和 处 理 等 ,又 可 以 克 
服 高 级 语言 对 数据 库 操作 的 不 足 , 从 而 获得 数据 库 的 处 理 能 力 。 嵌 入 式 SQL 与 高 级 语言 
之 间 的 交互 与 通信 需要 解决 以 下 问题 。 

(1) 如 何 区 分 SQL 语句 与 高 级 语言 语句 。 

(2) SQL 如 何 与 高 级 语言 进行 信息 传递 , 即 SQL 如 何 将 处 理 结果 传递 给 高 级 宿主 语 
言 , 宿 主语 言 又 如 何 将 参数 传递 给 SQL 。 

嵌入 式 SQL 的 语法 结构 与 自主 式 SQL 的 语法 结构 基本 相同 ,一般 是 给 嵌入 式 SQL 
加 入 一 些 前 级 和 结束 标志 。 对 于 不 同 的 高 级 宿主 语言 ,格式 上 略 有 不 同 。 以 C 语言 为 
例 , 格 式 如 下 : 





EXEC SQL 

<SQL 语 句 > 

说 明 : 在 C 语 言 中 嵌入 SQL 语句 ,以 EXEC SQL 为 开始 标志 ,以 “;” 为 结束 标志 。 

高 级 宿主 语言 与 SQL 之 间 的 通信 主要 通过 主 变量 和 SQL 通信 区 两 种 方式 进行 
交互 。 


1. 主 变量 





主 变量 即 宿主 变量 ,是 宿主 语言 中 定义 的 变量 ,可 以 在 嵌入 式 SQL 中 引用 ,用 于 艇 入 
式 SQL 与 宿主 语言 之 间 的 数据 交流 , 即 通过 主 变量 可 以 由 宿主 语言 向 SQL 传递 参数 ,又 
可 以 将 SQL 语句 处 理 结果 传 回 给 宿主 语言 。 主 变量 在 使 用 前 需要 定义 ,C 语言 中 主 变量 
的 定义 格式 如 下 : 











EXEC SQL BEGIN DECLARE SECTION; 
// 主 变量 定义 语句 
EXEC SQL END DECLARE SECTION; 


【 例 10.1】 定义 几 个 主 变 量 。 


EXEC SQL BEGIN DECLARE SECTION; 
CHAR stu_sno[10]; 

CHAR stu name[20]; 

INT sage 

EXEC SQL END DECLARE SECTION; 


在 嵌入 式 SQL 中 引用 主 变 量 时 ,需要 在 这 些 被 引用 的 主 变量 前 加 上 “:”, 而 在 宿主 
语言 中 使 用 主 变量 则 不 需要 添加 冒号 。 
【 例 10.2】 主 变 量 的 使 用 。 


EXEC SQL 
SELECT sname INTO:stu sname 
FROM student 


WHERE sno= :stu sno; 
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根据 主 变量 传人 的 学 号 值 stu_sno, 获 取 相 应 的 学 生 的 姓名 并 保存 在 主 变量 stu_ 


Sname 中 
2. SQL 通信 区 


SQL 通信 区 (SQL communication area) 反 映 SQL 语句 的 执行 状态 信息 ,如 数据 库 连 
接 状态 ,执行 结果 错误 信 息 等 。 它 是 一 个 全 局 的 数据 结构 ,里 面 存放 了 一 个 重要 的 变量 
SQLCODE,SQLCODE 包含 每 个 嵌入 式 SQL 语句 执行 后 的 结果 码 。SQLCODE=0 表 
示 SQL 语句 执行 成 功 ;SQLCODE<<0 表示 SQL 语句 执行 失败 ;SQLCODE=1 表示 SQL 
语句 已 经 执行 ,但 出 现 了 异常 。 


10.3 数据 库 编 程 语言 


在 数据 库 管理 系统 中 ,一 般 都 有 过 程 化 的 SQL 编程 语言 ,如 SQL Server 中 的 
Transact-SQL(T-SQL) ,Oracle 中 的 PL/SQL。 基 本 的 SQL 是 高 度 的 非 过 程 化 语言 。 概 
入 式 SQL 将 SQL 语句 嵌入 程序 设计 语言 中 ,借助 高 级 语言 的 控制 功能 实现 过 程 化 。 过 
程 化 SQL 是 对 SQL 的 扩展 ,使 其 增加 了 过 程 化 语句 功能 。 过 程 化 SQL 程序 的 基本 结构 
是 块 。 这 些 块 之 间 可 以 相互 嵌 套 。 


10.3.1 基本 语法 


一 般 而 言 ,过程 化 的 SQL 编程 结构 由 如 下 要 素 组 成 。 

(1) 注释 。 

(2) 常量 ,变量 。 

(3) 流程 控制 语句 。 

(4) 错误 和 消息 的 处 理 。 

基本 块 的 构成 类 似 如 下 形式 。 

定义 部 分 [DECLARE 。 /定义 的 变量 \ 常 量 只 能 在 该 基本 块 中 使 用 
pee // 当 基本 块 结束 时 ,定义 的 变量 就 不 再 存在 

BEGIN 

执行 部 分 SQL 语句 \ 流 程控 制 语句 


END; 


变量 对 于 语言 来 说 是 必 不 可 少 的 部 分 。T-SQL 中 有 两 类 变量 : 一 类 是 用 户 自 定义 
的 局 部 变量 ; 另 一 类 是 系统 定义 的 全 局 变量 。 局 部 变量 以 @ 开 头 ;全 局 变量 以 @@ 开 头 。 
定义 语句 为 


DECLARE @ variable DATATYPE.; 
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变量 赋值 : 


SET @ variable=expression; 


SELECT @ variable=expression; 
【 例 10.3】 在 学 生 管 理 系统 中 定义 一 个 变量 ,用 来 保存 学 生 的 人 数 ,并 显示 出 来 。 


USE student; 

GO 

DECLARE @ rowsreturn INT7 

SET @ rowsreturn= (SELECT COUNT (* ) FROM student); 
SELECT @ rowsreturn; 


上 例 中 除了 可 以 用 SET 赋值 ,也 可 以 改 成 用 SELECT 赋值 ,如 下 所 示 。 


USE student; 

GO 

DECLARE @ rowsreturn INT7 

SELECT @ rowsreturn=COUNT (* ) FROM student; 
SELECT @ rowsreturn; 


【 例 10.4】 定义 一 个 变量 ,用 来 保存 性 别 值 ,查询 出 相应 性 别 的 学 生 情 况 。 


USE student; 

GO 

DECLARE @ sex CHRAR (2); 

SET @ sex=' 女 '; 

SELECT * FROM student WHERE ssex=@ sex; 


2. 语句 块 


BEGIN…END 将 多 个 T-SQL 语句 组 合成 一 个 语句 块 ,并 将 语句 块 看 作 是 一 个 单元 
来 处 理 , 在 一 个 BEGIN…END 中 也 可 以 嵌 套 另外 的 语句 块 。 其 语法 为 

BEGIN 

< 命令 行 或 程序 块 > 

END 


用 BEGIN…END 改写 例 10. 3, 结 果 如 下 。 


DECLARE @ rowsreturn INT7 

BEGIN 

SET @ rowsreturn= (SELECT COUNT (* )FROM student); 
SELECT @ rowsreturn; 

END 


3. 条 件 分 支 语句 


IE 语句 
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IF boolean expression 
{sql statement1} 
ELSE 
{sql statement2} 


如 果 布 尔 表达 式 boolean_expression 为 真 , 则 执行 语句 块 sql_statementl ,否则 执行 
语句 块 sql_statement2。 

【 例 10.5】 在 学 生成 绩 管理 系统 中 ,学 号 为 201015121 的 学 生 的 平均 成 绩 如 果 大 于 
等 于 60 分 , 则 输出 PASS ,否则 输出 NOT PASS。 


IF (SELECT AVG (grade) FROM sc WHERE sno= '201015121' GROUP BY sno)>= 60 
BEGIN 
PRINT "PRSS 
END 
ELSE 
BEGIN 
PRINT "NOT PASS 
END 


4. 多 分 支 语句 


CASE input expression 
WHEN when_expression 1 THEN result expression 1 


WHEN when_expression m THEN result expression mm 
ELSE result expression n 
END 


当 表 达 式 input_expression 的 值 为 when_expression_1 时 , 则 执行 相应 的 result_ 
expression_1。 

当 表达 式 input_expression 的 值 为 when_expression_m 时 , 则 执行 相应 的 result_ 
expression_m。 

如 果 input_expression 的 值 都 不 满足 时 , 则 执行 result_expression_n。 

【 例 10.6】 在 学 生 管理 系统 中 ,查询 输出 学 生 的 选课 信息 ,根据 学 生 的 课程 号 显示 
相应 的 课程 名 称 , 根 据 考 试 分 数 显示 相应 的 成 绩 等 级 。 


SELECT sno RS 学 号 ,课程 名 称 =CASE cno 
WHEN 1 THEN "数据 库 ' 
WHEN 2 THEN ' 数 学 ' 
WHEN 3 THEN "信息 系统 " 
WHEN 4 THEN "操作 系统 
WHEN 5 THEN "数据 结构 " 
END, 


考试 等 级 =CASE 
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WHEN grade>= 90 THEN ' 优 秀 ' 
WHEN grade>=80 THEN ' 良 好 ' 
WHEN grade>=70 THEN "中 
WHEN grade>=60 THEN ' 及 格 ' 
ELSE ' 不 及 格 ' 
END 
FROM sc; 


运行 结果 如 图 10. 1 所 示 。 


悦 SELECT sno AS 学 号 ,课程 名 称 = CASE cno 
WHEN 1 THEN“ 教 据 库 
WHEN 2 THEN 
WHEN 3 THEN 
WHEN 4 THEN 
WHEN 5 THEN 


ED 
考试 等 级 - CASE 

WHEN grade)-90 THEN 优 

WHEN grade)-80 THEN 











学 号 课程 名 称 ”考试 等 级 
1 数据 库 。 优秀 
2 160610101 数学 良好 
3 160610101 信息 系统 ”良好 
4 
5 





160610102 数学 优秀 





160610102 ”信息 系统 “良好 





图 10.1 学 生成 绩 等 级 结果 


5. 循环 语句 


WHILE boolean expression 


{sql_statement} 


当 条 件 表达 式 boolean_expression 为 真 时 ,循环 执行 语句 块 sql_statement。 
【 例 10.7】 创建 一 个 test 表 , 并 给 这 个 表 插入 1000 行 数据 。 


CREATE TABLE test (id INT IDENTITY (1,1), sname CHAR(10)); 
GO 
DECLARE @i INT7 
SET @i=1; 
WHILE @i<=1000 
BEGIN 
INSERT INTO test (sname)VALUES ('tom'); 
SET @i=@i+1; 
END 
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运行 结果 如 图 10. 2 所 示 。 


SQLAuery1.sql - Pp...ministrator (55))* x 
ECREATE TABLE test(id INTIDENTITY (1,1), sname CHAR(10)) 

60 

DECLARE @i INT 

SET @i =1 















WHILE @i 1000 
BEGIN 
INSERT INTO test(sname) VALUES( ton ) 
SET @i=@i+*l 
ED 
SELECT oount(*) FROM test 


100%_ ~ 
国 结果 四 消息 
(无 列 名 ) 


图 10.2 插入 1000 行 数据 运行 结果 


10.3.2 存储 过 程 与 函数 


在 数据 库 中 的 程序 块 主要 有 两 种 类 型 : 一 种 为 命名 块 ;一 种 为 非 命 名 块 。 存 储 过 程 
为 命名 块 , 这 类 程序 块 被 编译 后 持久 保存 在 数据 库 中 ,可 以 被 反复 执行 ,运行 效率 高 ,安全 
性 高 。 由 于 程序 块 已 经 编译 好 ,因此 使 用 时 只 需 调用 就 可 以 了 。 

存储 过 程 是 一 组 编译 好 的 存储 在 数据 库 服务 器 上 ,完成 某 一 特定 功能 的 程序 代码 块 ， 
它 可 以 有 输入 参数 和 返回 值 。 存 储 过 程 分 为 系统 提供 的 存储 过 程 和 用 户 自 定义 的 存储 过 
程 。 其 中 ,系统 存储 过 程 可 以 在 数据 库 中 随时 调用 ,主要 用 来 进行 系统 信息 的 获取 ,系统 
信息 的 设置 .管理 ,安全 性 的 设置 等 。 使 用 存储 过 程 有 以 下 优点 。 

(1) 由 于 执行 存储 过 程 时 保存 的 是 已 经 编译 好 的 代码 块 ,所 以 可 直接 调用 执行 ,这 样 
效率 更 高 。 

(2) 像 函 数 一 样 ,模块 化 的 编程 ,可 以 反复 调用 执行 。 

(3) 使 用 存储 过 程 降低 了 客户 机 和 服务 器 之 间 的 通信 量 , 客 户 端 只 通过 网 络 向 服务 
器 发 送 调用 存储 过 程 的 名 字 和 参数 ,就 可 以 调用 执行 ,而 不 需要 发 送 程序 本 身 , 这 样 大 大 
减少 了 程序 量 。 

(4) 由 于 从 客户 端 传输 到 服务 器 端的 仅仅 是 存储 过 程 的 名 字 和 参数 ,保存 在 服务 器 
端的 是 已 经 编译 过 的 存储 过 程 ,并 且 只 有 具备 相应 权限 的 用 户 才 可 以 执行 ,因此 ,其 安全 
性 更 高 。 

以 SQL Server 为 例 , 创 建 用 户 自 定义 的 存储 过 程 的 语法 如 下 。 

CREATE PROC | PROCEDURE Pro_name 


[{@ 参 数 数据 类 型 } [= 默认 值 ] [oo0TPOT]， 
{8 参数 数据 类 型 } [= 默认 值 ] [oo0TPOT]， 


] 
RS 
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<SQL STATEMENTS> 


说 明 : 

pro_name: 存储 过 程 的 名 字 。 

@ 参 数 : 存储 过 程 里 用 到 的 参数 。 

数据 类 型 : 参数 的 数据 类 型 。 

默认 值 : 设置 参数 的 默认 值 。 

OUTPUT: 表示 输出 参数 ,保存 存储 过 程 向 外 传递 的 结果 , 当 不 带 OUTPUT 时 , 表 


示 输 入 参数 ,由 外 向 存储 过 程 传人 值 。 


SQL_STATEMENTS: 存储 过 程 体 .包含 在 过 程 中 的 一 个 或 者 多 个 T-SQL 语句 ,由 


声明 部 分 和 可 执行 语句 部 分 构成 。 


执行 存储 过 程 时 ,使 用 EXECUTE 语句 。 其 语法 格式 如 下 : 


EXEC[UTE] {[@ 整 型 变量 =]< 存 储 过 程 名 > }[ [8 参数 名 =] 

[{ 值 1 变量 [ouTPUT] | [DEFAULT]}[,…n]] 

说 明 : 

@ 整 型 变量 用 于 保存 存储 过 程 中 RETURN 语句 的 返回 值 。 

@ 参 数 名 是 指 在 存储 过 程 中 定义 的 参数 ,@ 变 量 选项 用 来 保存 参数 值 , OUTPUT 选 





项 是 指 输出 参数 ,DEFAULT 选项 是 指 该 参数 将 使 用 定义 时 提供 的 默认 值 。 


1. 创建 不 带 参数 的 存储 过 程 
【 例 10.8】 在 学 生 管理 系统 中 创建 一 个 查看 学 生 基本 信息 的 存储 过 程 。 


IE (EXISTS (SELECT # FROM sys.objects WHERE name= "proc get student')) 
DROP PROC proc get student 

go 

CREATE PROC proc get student 

RS 

SELECT * FROM student; 


调用 执行 存储 过 程 的 命令 如 下 : 

















EXEC proc get student; 


2. 创建 带 输 入 参数 的 存储 过 程 
【 例 10.9】 在 学 生 管 理 系 统 中 创建 一 个 存储 过 程 ,用 来 向 学 生 表 插 入 一 行 数据 ,该 


存储 过 程 设置 了 5 个 输入 参数 。 
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CREATE PROC insertstu 
@ sno CHAR (10) ， 

@ sname CHRAR (20) ， 

@ ssex CHAR (2) ， 

@ sage INT, 





@ sdept CHAR (20) 
AS 
BEGIN 


INSERT INTO student VALUES (@ sno, @ sname, ssex, sage,@ sdept) 
END 


执行 该 存储 过 程 的 代码 如 下 : 


EXECUTE insertstu @ sno= '201715128' ,QQ sname = "hxh',@ ssex = 'f',@ sage= 20,@ sdept = 'cs'; 
SELECT #* FROM student; 


执行 结果 如 图 10. 3 所 示 , 第 5 行为 调用 存储 过 程 插入 的 数据 。 
atovnTnql -Paninistnator 05 > OOO 


日 CREATE PROC insertstu 
@sno CHAR(10) 
@snane CHAR(20) 
@ssex CHAR(2) 
@sage INT 
@sdept CHAR (20) 
AS 
BEGIN 
INSERT INTO student VALUES(@sno, @snane ,@ssex ,@sage ,@sdept ) 
ED 





60 

EXECUTE insertstu @sno= 201 
G0 

SELECT * FROM student:| 





hi’, @ssex < f ,@sage-20, @sdept 


100% ~ 
国 结果 妨 汗 

sno sneme ssex sage sdept 
2 160610102 何 眶 男 20 network 
3 160610103 和 孙 普 男 18 computer 
4 160610105 张 慧 女 19 database 











hxh £ 20 es 


图 10.3 带 输入 参数 存储 过 程 及 运行 结果 





3. 创建 带 输出 参数 的 存储 过 程 


【 例 10. 10〗 在 学 生 管理 系统 中 创建 一 个 存储 过 程 ,根据 输入 学 生 的 学 号 ,输出 该 学 
生 的 年 龄 。 


CREATE PROC selecstudent 
@ sno CHAR (10) ， 

@ sage INT OUTPUT 

RS 


SELECT @ sage= sage FROM student WHERE sno= sno; 
执行 该 存储 过 程 的 命令 如 下 : 


DECLARE @ sagel INT; 
EXECUTE selecstudent '201015121",@ sagel OUTPUT; 
SELECT @ sagel; 





181 











数据 库 原理 及 应 用 


删除 存储 过 程 的 语法 如 下 : 
DROP {PROC | PROCEDURE} {procedure name} 


procedure_name: 要 删除 的 存储 过 程 的 名 字 。 
删除 前 面 的 存储 过 程 proc_get_student。 


DROP PROCEDURE proc get student; 


在 数据 库 编 程 中 ,函数 是 另 一 类 命名 程序 块 , 它 完成 某 一 特定 功能 可 以 持久 保存 。 郴 


数 分 为 系统 函数 和 用 户 自 定义 函数 ,系统 函数 可 以 直接 调用 。 函 数 的 定义 和 存储 过 程 类 
似 , 但 是 函数 必须 指定 返回 类 型 。 其 语法 格式 如 下 : 


CREATE FUNCTION function name (8 parameter name 
[AS] parameter datatype[=DEFAULT] [,**…n]) 
RETURNS return datatype 

RS 

BEGIN 

function body 

RETURN expression 

END 


参数 说 明 如 下 。 

function_name: 自 定义 函数 名 称 。 

@parameter_name: 自 定义 函数 的 形式 参数 。 

parameter_datatype: 参数 的 数据 类 型 ,可 以 为 形式 参数 设置 DEFAULT 默认 值 。 
return_datatype: 返回 值 的 数据 类 型 。 

function_body: 函数 体 部 分 ,由 BEGIN…END 括 起 来 ,RETURN 用 来 返回 函数 值 。 
【 例 10.11】 在 学 生 管理 系统 中 编写 一 个 函数 ,输入 某 个 学 生 的 学 号 ,查询 该 学 生 的 


年 龄 。 
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CREATE FUNCTION fun age(@ stu no char (20)) 

RETURNS INT 

RS 

BEGIN 

DECALARE @ stu age int 

SET @ stu age= (SELECT age FROM student WHERE sno= stu_ no) 
RETURN @ stu age 

END 


删除 函数 的 命令 为 
DROP FUNTION function name; 
删除 例子 中 的 fun_age 函数 ,其 命令 为 


DROP FUNCTION fun age 


数据 库 编程 


10.3.3 触发 器 


触发 器 (trigger) 实 际 上 也 是 一 类 特殊 的 存储 过 程 ,但 是 它 不 像 存储 过 程 那样 由 用 户 
直接 调用 执行 ,而 是 当 满 足 一 定 条 件 时 ,由 系统 自动 触发 执行 。 它 可 以 实现 比 约束 更 为 灵 
活 和 复杂 的 数据 限制 规则 ,用 来 实施 复杂 的 用 户 自 定义 完整 性 约束 ,使 得 数据 库 中 的 数据 
满足 一 定 要 求 。 

触发 器 也 称 作 事件 -条 件 -动作 规则 。 具 体 说 明 如 下 。 

(1) 当 事 件 发 生 时 ,触发 器 被 激活 。 

(2) 当 满足 触发 条 件 时 ,执行 触发 器 里 定义 的 动作 ; 当 不 满足 触发 条 件 时 ,不 做 任何 
事情 。 

其 中 ,事件 一 般 是 对 某 个 表 的 插入 \ 删 除 .修改 操作 (CDML 语句 ) 或 者 DDL 定义 语句 ; 
而 动作 主要 是 指 任何 一 组 数据 库 操作 语句 。 

触发 器 的 作用 如 下 。 

(1) 触发 器 可 以 实现 比 约束 更 为 复杂 的 数据 约束 规则 ,在 数据 库 中 的 数据 完整 性 约 
束 行为 一 般 使 用 CHECK 约束 来 实现 ,但 是 CHECK 约束 一 般 只 能 引用 本 表 的 列 , 不 能 
引用 其 他 表 中 的 属性 列 或 者 其 他 的 数据 库 对 象 , 而 触发 器 却 可 以 ; 除 此 之 外 ,触发 器 还 可 
以 完成 比较 复杂 的 逻辑 。 例 如 , 当 一 个 订单 产生 时 ,检查 库存 表 中 是 否 有 足够 的 库存 
产品 。 

(2) 触发 器 可 以 实现 对 相关 表 的 级 联 修改 。 

(3) 可 以 修改 其 他 表 里 的 数据 。 

(4) 对 于 视图 的 择 入、 删除 ,修改 操作 ,可 以 转化 为 对 基本 表 的 操作 。 

(5) 可 以 在 触发 器 中 调用 一 个 或 者 多 个 存储 过 程 。 

(6) 可 以 更 改 原本 要 操作 的 SQL 语句 。 例 如 ,对 某 表 执行 一 条 删除 SQL 语句 ,而 该 
表 里 的 数据 非常 重要 ,不 允许 删除 ,那么 通过 触发 器 ,可 以 不 执行 该 删除 操作 ; 同样 ,还 可 
以 防止 数据 表 结 构 更 改 或 者 数据 表 被 删除 。 

在 SQL Server 中 创建 触发 器 的 语法 如 下 : 





CREATE TRIGGER trigger name 

ON <table name|view name> 

{FOR |AFTER| INSTEAD OF} 

{ [INSERT] [, ] [UPDATE] [,] [DELETE ] [,]} 
RS 


sq]_statement 


有 关 语句 说 明 如 下 : 

trigger_name: 触发 器 的 名 字 。 

table_name| view_name: 要 建立 触发 器 的 表 或 者 视图 。 

AFTER: 表示 指定 的 触发 事件 发 生 之 后 ,触发 器 才 被 激活 。 而 FOR 为 指定 的 触发 
和 件 操作 之 前 触发 器 就 被 触发 。 


由 
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INSTEAD OF: 替代 触发 器 。 指 不 执行 相应 的 指定 操作 ,而 执行 触发 器 里 的 内 容 。 

{[INSERT]L,]LUPDATE][,]LDELETE 并 ,]}: 激发 触发 器 的 事件 ,三 者 任 选 , 顺 
序 不 限定 。 

AS: 引导 后 面 的 触发 器 程序 体 。 

sql_statement: 触发 器 触发 时 ,执行 的 操作 语句 。 

【 例 10.12】 在 学 生 管理 系统 中 的 student 表 上 创建 一 个 触发 器 , 当 对 student 表 插 
入 数据 时 引发 ,显示 “该 表 将 会 执行 插入 操作 ”。 


CREATE TRIGGER tri ins stu 

ON student 

FOR insert 

RS 

PRINT 'the table will be inserted'" 


然后 运用 如 下 插入 命令 验证 触发 器 的 执行 ,如 图 10.4 所 示 。 


INSERT INTO student (sno, sname) VALUES ("01"，tom'") 








SQLQuery1.sql - P...ministrator (55))” x 
SCREATE TRIGGER tri_ins_stu 
ON student 
FOR insert 
AS 
PRINT “ the table will be inserted 
G0 
INSERTINTO student(sno, sname) VALUES ( Di ，tom ) 
100% ~ 
提 消息 
the table will be inserted 


(1 行 受 时 0) 








图 10.4 创建 触发 器 


【 例 10.13】 在 学 生 管理 系统 中 删除 student 表 中 的 数据 时 引发 触发 器 ,禁止 删除 表 
中 的 数据 。 


CREATE TRIGGER forbidden delete 
ON student 

FOR DELETE 

RS 

BEGIN 

RAISERROR(' 未 授权 ',10,1) 
ROLLBACK 

END 


删除 触发 器 的 命令 为 


DROP TRIGGER trigger _ name 
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10.3.4 游标 


SQL 语句 的 执行 结果 只 能 整体 处 理 , 不 能 一 次 处 理 一 行 , 而 当 查询 返回 多 行 记录 时 ， 
只 能 通过 游标 对 结果 集中 的 每 行进 行 处 理 。 游 标 类 似 程序 设计 语言 中 的 指针 。 可 以 对 
SQL 语句 建立 游标 。 游 标的 操作 一 般 分 为 以 下 几 个 步骤 。 

(1) 定义 游标 ,游标 在 使 用 之 前 必须 先 定义 。 游 标 一 般 定 义 在 SQL 语句 上 。 

(2) 打开 游标 ,游标 定义 后 ,在 使 用 它 之 前 需要 先 打 开 , 使 其 指向 第 一 条 SQL 记录 。 

(3) 推进 游标 ,移动 游标 指针 ,可 以 遍历 游标 里 的 所 有 记录 ,进行 逐 行 处 理 。 

(4) 关闭 游标 ,释放 游标 占用 的 资源 。 

在 SQL Server 中 建立 游标 的 语法 如 下 : 


DECLARE cursor name CURSOR [ LOCAL | GLOBAL ] 

[ FORWARD ONLY | SCROLL ] 

[ STATIC | KEYSET | DYNAMIC | FAST FORWARD ] 

[ READ ONLY | SCROLL LOCKS | OPTIMISTIC ] 

[ TYPE_ WARNING ] 

FOR select statement 

[ FOR UPDATE [ OF column name [,**“n]]] 

[2] 

语法 说 明 如 下 。 

cursor_name: 游标 的 名 字 。 

select_statement: 建立 游标 的 SQL 语句 。 

【 例 10.14】 在 学 生成 绩 管理 系统 中 创建 一 个 简单 的 游标 , 按 一 定 的 格式 输出 
student 表 中 所 有 学 生 的 学 号 和 姓名 。 由 于 每 行 数据 都 以 一 定 的 格式 输出 ,因此 需要 使 用 
游标 ,代码 如 下 。 


DECLARE cstudent CURSOR SCROLL FOR // 声 明 游 标 
SELECT sno, sname FROM student 

OPEN cstudent // 打 开 游 标 
DECLARE @ sno CHAR(10) // 声 明 局 部 变量 


DECLARE @ sname CHAR (20) 

FETCH NEXT FROM cstudent INTO @ sno,@ sname 。 // 获 取 游 标 第 一 行 数据 ,保存 到 变量 

WHILE @ @ FETCH_STATUS=0 // 根 据 状态 变量 FETCH_sTATUS 循环 显示 游标 中 每 行 的 值 
BEGIN 

PRINT ' 学 号 '+@ sno 

PRINT ' 姓 名 '+@ sname 

FETCH NEXT FROM cstudent INTO @ sno,@ sname 

END 

CLOSE cstudent 


运行 结果 如 图 10. 5 所 示 。 
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Ea er 5 | 


SDECLARE cstudent CURSOR SCROLL FOR 
SELECT sno, sname FROM student 
OPEN cstudent 
DECLARE @sno CHAR(10) 
DECLARE @snarme CHAR(20) 
FETCH NEXT FROM cstudent INTO @sno,@sname 
WHILE Og TATUS=0 
DBEGIN 
PRINT “学 号 +@sno 
PRINT “姓名 +@sname 





FETCH NEXT FROM cstudent INTO @sno,@sname 
END 
CLOSE cstudent 


li00% ~ 
昂 汗 
学 号 160610101 
名 刘 佳 


学 号 160610102 
姓名 何 鼎 


学 吕 160610103 
姓名 孙 亚 


学 吕 160610105 
姓名 张 下 





图 10.5 创建 游标 输出 student 表 中 的 信息 


10.4 数据 库 接 口 及 访问 技术 


通过 一 个 数据 库 接口 可 以 实现 编程 开发 语言 与 数据 库 的 连接 。 而 数据 库 标 准 接口 可 
以 实现 开发 语言 与 多 种 不 同 数据 库 进 行 连接 。 这 样 的 接口 有 ODBC、JDBC、OLEDB、 
ADO、ADO. NET 等 。 其 中 ,ODBC、OLEDB、ADO、ADO. NET 都 是 由 微软 公司 开发 的 ， 
用 于 连接 微软 的 开发 语言 与 数据 库 。 而 JDBC 接口 是 Java 语言 用 来 进行 数据 库 连 接 的 


接口 。 采 用 ODBC、JDBC、ADO. NET 接口 的 体系 架构 如 图 10.6 所 示 。 
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图 10.6 数据 库 接口 及 访问 技术 























数据 库 访 问 技术 包括 C/S 和 B/S 两 种 访问 数据 库 结构 。C/S 结构 的 用 户 通过 客户 
端 访问 数据 库 服 务 器 ;B/S 结构 的 用 户 通过 浏览 器 访问 数据 库 。 目 前 比较 受 欢迎 的 网 页 
编程 语言 有 JSP、ASP. NET、PHP。 


10.4.1 ADO. NET 编程 


ASP. NET 的 访问 技术 的 体系 结构 如 图 10.7 所 示 。 











-== Web 
浏览 器 各 器 


| 1 
ASP.NET 程 序 
(#.aspx) 


数据 库 
| | 


ADONET 数据 库 服务 器 


图 10.7 ASP.NET 的 访问 技术 的 体系 结构 












































在 微软 公司 的 ASP. NET 技术 体系 结构 中 ,与 数据 库 进行 交互 需要 用 到 编程 接口 
ADO. NET(ActiveX Data Objects. NET) , 它 是 . NET 平台 内 用 于 访问 数据 源 的 一 组 类 ， 
是 ADO 的 后 续 版 本 ,通过 ADO. NET 就 能 在 数据 库 中 执行 SQL 语句 或 存储 过 程 。 
ADO. NET 数据 库 连接 需要 用 到 以 下 3 个 命名 空间 。 

System. Data. SqlClient: 用 来 连接 本 地 SQL 服务 器 。 

System. Data. OleDb: 用 来 连接 OLE-DB 数据 源 。 

System. Data: 用 于 数据 库 的 高 层 访问 。 

ADO. NET 的 类 主要 由 两 部 分 组 成 : 数据 提供 (Data Provider) 程序 和 数据 集 
CDataSet) 。 前 者 负责 与 物理 数据 源 连 接 , 后 者 代表 实际 的 数据 。 ADO. NET 包含 的 对 象 
及 它们 之 间 的 交互 如 图 10. 8 所 示 。 

数据 提供 程序 主要 包括 Connection 对 象 、Command 对 象 、DataReader 对 象 、 
DataAdapter 对 象 。 数 据 集 对 象 主要 指 DataSet 记录 内 存 中 的 数据 。 

数据 库 连 接 分 为 以 下 几 个 步骤 。 

(1) 建立 连接 ,通过 SqlConnection 类 与 数据 库 建立 连接 。 

(2) 执行 SQL 命令 ,通过 SqlCommand 类 执行 SQL 语句 。 

(3) 获取 SQL 执行 结果 ,通过 DataAdapter 或 者 DataReader 和 DataSet 对 象 获取 数据 。 

(4) 关闭 数据 库 连接 。 

例如 ,在 开发 环境 Visual Studio 2015 中 ,采用 ASP. NET 技术 访问 SQL Server 
2014 ,输出 学 校 的 通知 公告 信息 ,显示 在 页 面 的 GridView 控件 中 ,其 源 代码 如 下 所 示 。 
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ADO.NET 
DataSet 
二 一 
DataAdapter | Command |=——™| DataReader 
SR i 
Connection 
数据 提供 程序 
1 
数据 源 











10.8 ”ADO. NET 包含 的 对 象 及 它们 之 间 的 交互 


SqlConnection cn= 

new SqlConnection ("server= localhost;database= chengji;user= sa;password= 123456"); 
SqlCommand cmd= new SqlCommand ("SELECT * FROM tongzhi", cn); 

SqlDataAdapter da= new SqlDataAdapter (cmd); 

DataSet ds=new DataSet (); 

da.Fill (ds, "tongzhi"); 

GridViewl .DataSource=ds.Tables[0] .DefaultView; 

GridView1.DataBind (); 


在 Visual Studio 中 执行 以 上 代码 ,结果 如 图 10. 9 所 示 。 



























































- 0O x 
[本 http://localhost49815/studentmainframe1.aspx pro 5 
Ei x 
次 目 有 本 网 园 京东 高城 目 ] 族 行 机 票 加 汽 主 国 隐 全 天 商城 站 天 总 市 目 9.9 包 部 
学 校 公告 
蝙 号 标题 所 有 者 | 时 间 内 容 
1 [重修 开始 了 | 所 有 人 |2014/4/20 星期 日 17:08:27| 
2 ”成绩 如 有 疑问 ， 可 以 去 教务 处 核对 所 有 人 |2014/4/20 星期 日 17:09:41 
3 | 亩 业 设计 2017/5/22 星期 一 22:09:35) 
上 4 呼 业 答辩 |2017/5/22 星期 一 22:09:49| 
9 “刚刚 刚 | 各 个 |2017/5/23 星期 二 18:03:33 
10 方法 方法 |2017/5/23 星期 二 18:05:42 频 烦 烦 
11 lggg ggg ”|2017/5/23 星期 二 20:24:07|ggg 
胞 100% > 








图 10.9 ASP.NET 技术 访问 SQL Server 2014 结果 
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变量 cn 是 一 个 SqlConnection 对 象 ,用 来 连接 数据 源 , 其 连接 字符 串 "server 王 
localhost; database 一 chengji; user 一 sa;password 王 123456" 由 一 组 关键 字 和 值 组 成 ,有 固 
定 的 格式 ,一 般 用 双 引 号 或 者 单 引号 括 起 来 。 连 接 字符 串 的 值 说 明 需 要 连接 的 数据 库 所 
在 的 地 址 及 连接 用 户 ,localhost 表示 在 本 地 服务 器 ,目标 数据 库 为 chengji, 连 接 用 户 为 
sa, 密 码 为 123456 。Connection 对 象 的 常用 方法 是 open() 和 close() ,表示 打开 连接 和 关 
闭 连 接 。 这 两 个 方法 可 以 显示 调用 ,或 由 DataAdapter 对 象 和 Command 对 象 自动 调用 。 

变量 cmd 是 一 个 Command 对 象 ,用 来 执行 存储 过 程 或 者 增 \ 删 \ 改 、 查 语句 ,该 对 象 的 两 个 
参数 值 分 别 表示 执行 的 SQL 语句 和 连接 对 象 ,这 里 执行 查询 语句 "SELECT * FROM tongzhi"。 

SqlDataAdapter 数据 适配器 对 象 在 数据 集 DataSet 对 象 和 数据 库 数据 之 间 起 到 桥梁 
的 作用 , 它 接收 来 自 Connection 对 象 连接 的 数据 库 中 的 数据 并 保存 在 内 存 表 中 ,再 传递 
给 数据 集 ds, 反 过 来 ,也 可 以 将 数据 集 的 变化 传 给 数据 源 。SqlDataAdapter 对 象 支持 Fill 
方法 ,把 数据 从 数据 源 加 载 到 数据 集中 ,代码 中 的 语句 da. Fill(ds,"tongzhi") 实 现 了 此 功 
能 ;支持 Update 方法 把 数据 从 数据 集 加 载 到 数据 源 中 。 

数据 集 对 象 为 数据 表 的 集合 ,数据 表 包 含 了 实际 的 数据 。 代 码 中 的 语句 ds. Tables[0] 
. DefaultView 表示 数据 集 对 象 ds 的 第 一 个 数据 表 , 并 通过 DefaultView 属性 设置 输出 格式 。 

设置 控件 GridViewl 的 数据 源 为 数据 集 ds 中 的 数据 表 。SqlDataAdapter 对 象 能 自 
动 调用 打开 和 关闭 数据 库 连 接 的 Open() 方 法 和 Close() 方 法 。 





10.4.2 JDBC 编程 


JDBC(Java DataBase Connectivity) 是 Java 语言 访问 各 种 数据 库 的 一 组 标准 的 Java 
API, 既 可 以 访问 数据 库 MySQL、SQL Server, 也 可 以 访问 数据 库 Oracle。Java API 通过 
相应 的 JDBC 驱动 程序 访问 具体 的 数据 库 , 如 图 10. 10 所 示 。 
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程序 
应 用 层 
ee PT 1 
JDBC 的 API 
1 JDBC 
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JDBC ODBC 
驱动 程序 驱动 程序 
数据 层 





图 10.10 JDBC 访问 数据 库 
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JDBC 驱动 程序 分 为 4 类 ,而 对 于 具体 的 数据 库 系 统 , 一 般 需 要 从 该 数据 库 提供 商 那 
里 获得 相应 的 JDBC 驱动 程序 。 例 如 ,访问 MySQL 数据 库 ,需要 使 用 MySQL 的 JDBC 
驱动 程序 ,而 访问 SQL Server 数据 库 , 需 要 使 用 SQL Server 的 JDBC 驱动 程序 。JDBC 
访问 数据 库 的 过 程 如 下 。 

第 一 步 : 加 载 JDBC 驱动 程序 ,建立 数据 库 连接 。 

第 二 步 : 执行 SQL 语句 。 

第 三 步 : 处 理 SQL 语句 执行 结果 。 

第 四 步 ; 关闭 数据 库 连接 。 

例如 ,Java 连接 SQL Server 2005, 源 代码 如 下 。 


import java.sql.*; // 导 入 JDBC 相关 的 类 
public class test java{ 
public static void main (String[] args)throws Exception { 
String id=null,name=null; 
String sql="SELECT* FROM authors"; 
try{ 
Class.forName ("com.microsoft.jdbc.sqlserver.SQLServerDriver"); 
Connection conn= 
DriverManager.getConnection ("jdbc:microsoft:sqlserver://hxh:1433; 
DatabaseName=pubs", "sa™, ""); // 连 接 字 符 串 说 明 连 接 数 据 库 的 地 址 用户 、 
密码 
Statement stmt=conn.createStatement () 7 
ResultSet rs= stmt .executeQuery (sql); 
while (rs.next ()) { // 循 环 处 理 查询 结果 集中 的 内 容 
idq= rs.getString(1)7 
name=rs.getSstring (2); 
System.out .println("id "+id); 
System.out.println ("name "+name); 
} 
rs.close(); 
stmt.close(); 
conn.close ()7 
}catch (Exception e){ 
System.out .println ("数据 访问 结束 ");} 
} 
} 


例如 ,JSP 连接 SQL Server 2005, 源 代码 如 下 。 


<$%Q@ page contentType= "text/html;charset=gb2312"%> 
< %@ page import="java.sql.* "$%> 
<html> 
<body> 
< gClass.forName ("com.microsoft .jdbc.sqlserver.SQLServerDriver") .newInstance (); 
String url= "jdbc:microsoft:sqlserver://localhost:1433;DatabaseName=pubs"; 
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//pubs 为 数据 库 
String useI= "sa"7 
String password= ""7 
Connection conn= DriverManager.getConnection (Url,user,password) 7 
Statement stmt= 
conn.createStatement (ResultSet.TYPE SCROLL SENSITIVE,ResultSet.CONCUR 
UPDRTRBLE) 7 
String sql= "SELECT * FROM test"; 
ResultSet rs= stmt .executeQuery (sql); 
while(rs.next () ) {%> 
您 的 第 一 个 字段 内 容 为 :<%=rs.getstring(1)%><br> 
您 的 第 二 个 字段 内 容 为 :<%=rs.getstring (2)%><br> 

<%}%> 

<%out.print (" 数 据 库 操作 成 功 ,恭喜 你 ") ;%> 

<%rs.close(); 
stmt .close(); 
conn.close () 7 
%> 
< /body> 
</htm> 


以 上 两 个 程序 分 别 给 出 了 Java 和 JSP 通过 JDBC 访问 数据 库 的 简单 例子 ,以 上 两 段 
代码 非常 类 似 , 主 要 由 建立 连接 ,执行 SQL .获取 执行 结果 、 关 闭 连接 4 个 步骤 组 成 。 代 
码 Class. forName("com. microsoft. jdbc. sqlserver. SQLServerDriver") ;加 载 SQL Server 数据 
库 驱 动 器 程序 类 ,之 后 可 以 获取 对 SQLServerDriver 数据 库 驱 动 器 类 的 引用 。 通 过 
Connection 对 象 建立 对 数据 库 的 连接 ,连接 字符 串 的 值 设 置 数据 库 的 URL 以 及 用 户 名 
和 密码 ;由 当前 数据 库 连 接生 成 数据 库 操 作对 象 stmt; 用 该 操作 对 象 执行 数据 库 查 询 操 
作 stmt. executeQuery(sql) ; ResultSet 结果 集 对 象 存储 查询 结果 ;关闭 结果 集 rs. close() ; 关 
闭 操作 对 象 stmt. close() ;关闭 数据 库 连接 conn. close() 。 














10.5 小 结 


本 章 讨 论 了 数据 库 编程 相关 的 内 容 , 包 括 戏 和 人 式 SQL 数据 库 编 程 语言 T-SQL \ 应 用 
编程 接口 ADO. NET 和 JDBC ,并 分 别 给 出 了 具体 的 实例 。 嵌 入 式 SQL 介绍 了 把 SQL 
语句 嵌入 到 高 级 语言 中 ,以 及 如 何 与 高 级 语言 进行 交互 的 相关 内 容 。 数 据 库 编程 语言 工 
SQL 部 分 包含 基本 语法 ,存储 过 程 、 函 数 、 触 发 器 ,游标 的 内 容 , 曾 述 了 数据 库 编 程 接口 及 
访问 技术 ,简单 介绍 了 JDBC 和 ADO. NET 接口 ,并 给 出 连接 数据 库 的 应 用 案例 。 


10.6 习题 


选择 你 所 熟悉 的 任 一 种 编程 开发 语言 及 相应 的 编程 接口 ,访问 你 所 熟悉 的 数据 库 中 
的 数据 。 
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第 11 章 ”数据库 设计 


数据 库 是 数据 库 应 用 系统 的 核心 内 容 ,因此 ,数据 库 设 计 也 是 数据 库 应 用 系统 设计 开 
发 中 的 核心 内 容 。 到 底 什 么 是 数据 库 设 计 呢 ? 它 实 际 上 是 指 给 定 具 体 的 应 用 环境 ,给 出 
合适 优质 的 数据 库 设计 方案 ,并 建立 数据 库 及 开发 出 数据 库 应 用 系统 。 数 据 库 的 设计 涉 
及 多 门 计算 机 学 科 知识 ,需要 具备 一 定 的 经 验 和 业务 知识 ,并 与 用 户 紧密 联系 , 才 可 以 开 
发 出 符合 要 求 的 数据 库 应 用 系统 。 


11.1 数据 库 设 计 概 述 


本 节 内 容 主要 包括 数据 库 设计 的 目标 及 任务 数据 库 设计 的 方法 和 步骤 。 

数据 库 设计 的 任务 ,从 狭义 上 来 说 ,是 为 给 定 的 应 用 环境 设计 数据 库 本 身 , 设 计 优化 
的 数据 库 结 构 并 建立 数据 库 ,实现 数据 的 存 取 ,满足 用 户 对 数据 的 需求 ,稳定 有 效 地 支持 
整个 数据 库 应 用 系统 的 运行 。 本 书 的 重点 是 从 狭义 上 讲述 数据 库 设计 , 它 是 数据 库 应 用 
系统 的 设计 基础 ,一 个 好 的 数据 库 应 用 系统 的 开发 离 不 开 一 个 好 的 数据 库 设 计 , 它 们 是 紧 
密 联系 在 一 起 的 。 从 广义 上 来 说 ,数据 库 设计 任务 既 包括 数据 库 本 身 的 设计 ,也 包括 数据 
库 应 用 系统 的 设计 , 即 包括 数据 库 的 结构 设计 和 数据 库 的 行为 设计 。 数 据 库 的 行为 设计 
主要 指 的 是 数据 库 应 用 系统 的 功能 需求 .业务 需求 的 设计 。 数 据 库 应 用 系统 的 行为 设计 
和 结构 设计 是 紧密 结合 在 一 起 的 。 

数据 库 设 计 的 目标 是 设计 一 个 完整 的 ,规范 的 数据 库 模型 ,使 它 能 够 有 效 地 存储 和 管理 数 
据 , 满 足 各 种 用 户 的 应 用 需求 ,包括 信息 管理 要 求 和 数据 操作 要 求 。 具 体 要 达到 以 下 要 求 。 

(1) 减少 有 害 的 数据 宛 余 ,提高 程序 共享 。 

(2) 消除 异常 插入 .更 新 删除。 

(3) 保证 数据 的 独立 性 、 可 修改 、 可 扩充 。 

(4) 访问 数据 库 的 时 间 要 尽 可 能 短 。 

(5) 数据 库 的 存储 空间 要 小 。 

(6) 保证 数据 的 完整 性 、 安 全 性 。 

(7) 易于 维护 。 


11.1.1 数据 库 设计 方法 


数据 库 设计 在 没有 形成 一 套 规范 化 的 方法 之 前 ,主要 依赖 于 设计 者 的 经 验 ,而 这 样 设 
计 出 来 的 数据 库 既 耗费 时 间 ,也 不 能 很 好 地 满足 用 户 需求 ,质量 也 得 不 到 保证 ,导致 数据 
库 设计 变 成 了 一 个 非常 麻烦 、 复 杂 的 工作 。 经 过 长 时 间 的 摸索 与 讨论 ,数据 库 专家 们 提出 
了 一 些 规范 化 的 设计 方法 。 
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数据 库 设计 规范 化 的 方法 有 很 多 种 ,本 教材 的 设计 篇 主要 按照 E-R 模型 设计 法 进行 
编排 ;而 本 章 主要 介绍 的 设计 方法 是 基于 新 奥尔良 法 。 实 际 上 ,在 数据 库 的 设计 过 程 中 采 
用 了 多 种 设计 相 结 合 的 方法 。 比 较 流行 的 数据 库 方 法 有 如 下 3 种 。 

(1) 新 奥尔良 法 ,在 1978 年 10 月 ,是 由 来 自 30 多 个 国家 的 数据 库 专家 在 美国 的 新 
奥尔良 讨论 出 来 的 结果 ,因此 命名 为 新 奥尔良 法 。 它 运用 软件 工程 的 思想 和 方法 把 数据 
库 设 计 分 为 需求 分 析 、 概 念 结构 设 计 、 催 辑 结 构 设计 物理 结构 设计 4 个 阶段 。 它 是 目前 
公认 的 比较 完整 的 数据 库 设计 方法 。 

(2) E-R 模型 法 ,是 由 P.P.S. Chen 于 1976 年 提出 来 的 。 它 根据 数据 库 应 用 环境 的 
需求 分 析 建立 E-R( 实 体 一 联系 ) 模 型 ,反映 现实 世界 实体 及 实体 间 的 联系 ,然后 转化 为 相 
应 的 某 种 具体 的 DBMS 所 支持 的 逻辑 模型 。 

(3) 3NF 法 ,由 S.Atre 提 出。 同样 ,首先 对 数据 库 应 用 环境 进行 需求 分 析 , 确 定数 据 
库 结构 中 全 部 的 属性 并 把 它们 放 在 一 个 关系 中 ,根据 需求 分 析 描 述 的 属性 之 间 的 依赖 关 
系 规范 化 到 3NF。 

除 此 之 外 ,数据 库 设 计 方法 还 有 面向 对 象 方法 、 统 一 建 模 语言 (Unified Model 
Language,UML) 方 法 等 。 但 在 数据 库 的 设计 过 程 中 ,同时 采用 多 种 设计 相 结 合 的 方法 能 
够 设计 出 更 优秀 的 数据 库 , 如 在 新 奥尔良 法 的 设计 过 程 中 ,概念 结构 设计 阶段 一 般 采 用 
E-R 图 法 ,在 迎 辑 结构 设计 的 优化 过 程 中 采用 3NF 法 。 

在 数据 库 设计 过 程 中 引进 计算 机 辅助 手段 设计 数据 库 , 使 得 数据 库 的 设计 过 程 更 加 
容易 .规范 。 如 概念 模型 的 建立 及 概念 模型 到 逻辑 模型 的 转化 ,甚至 数据 库 的 创建 都 可 以 
采用 计算 机 辅助 软件 工程 (Computer Aided Software Engineering,CASE) 工 具 进 行 。 市 
场 上 比较 流行 的 数据 库 辅 助 设 计 工 具有 Sybase 公司 的 PowerDesigner、Rational 公司 的 
Rational Rose CA 公司 的 ERWin .Oracle 公司 推出 的 Oracle Designer。 


11.1.2 数据 库 设计 步骤 


按照 结构 化 系统 设计 的 方法 ,在 新 奥尔良 数据 库 设计 方法 的 基础 上 ,增加 了 数据 库 实 
施 和 运行 维护 两 个 阶段 。 因 此 ,完整 的 数据 库 设计 分 为 需求 分 析 、 概 念 结构 设计 、 逻 辑 结 
构 设 计 、 物 理 结构 设计 .数据库 实施 ,数据 库 运 行 和 维护 6 个 阶段 ,如 图 11. 1 所 示 。 

在 数据 库 设计 过 程 中 ,参与 的 人 员 包 括 系统 分 析 人 员 、 数 据 库 设 计 人 员 、 应 用 程序 开 
发 人 员 ,数据 库 管理 员 和 用 户 代 表 。 系 统 分 析 人 员 及 数据 库 设计 人 员 将 全 程 参 与 数据 库 
设计 ,并 决定 设计 的 质量 。 用 户 代 表 和 数据 库 管理 员 主 要 参与 需求 分 析 与 数据 库 的 运行 
和 维护 工作 。 应 用 程序 开发 人 员 负 责 程序 的 编写 ,参与 实施 工作 。 


1. 需求 分 析 阶 段 


这 个 阶段 是 整个 数据 库 设 计 的 基石 ,没有 良好 的 需求 分 析 ,就 不 会 有 合适 的 数据 库 设 
计 方 案 。 因 此 ,在 这 个 阶段 要 充分 了 解 组 织 机 构 的 运行 情况 ,掌握 好 用 户 的 需求 ,才能 构 
建 良好 的 数据 库 设计 , 它 决定 了 数据 库 的 质量 ,如 果 需 求 分 析 做 得 不 好 ,经 常 需要 返工 , 导 
致 耗费 人 力 、 物 力 、 财 力 。 
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11.1 数据 库 设计 步骤 


2. 概念 结构 设计 阶段 


概念 结构 设计 阶段 是 独立 于 具体 数据 库 管理 系统 的 ,是 数据 库 设计 的 关键 ,设计 出 的 
概念 数据 模型 需要 能 完整 而 且 合理 地 表达 出 用 户 的 需求 。 


3. 逻辑 结构 设计 阶段 


将 概念 数据 模型 转化 为 数据 库 管理 系统 所 支持 的 某 种 人 逻辑 数据 模型 。 可 以 转化 为 关 
系数 据 模型 ,也 可 以 转化 为 面向 对 象 的 数据 模型 ,一般 转化 为 市 场 上 流行 的 关系 模型 ,并 
对 其 进行 优化 。 


4. 物理 结构 设计 阶段 

为 逻辑 数据 模型 选取 一 个 最 适合 的 物理 结构 ,包括 存储 结构 和 存 取 方法 。 
5. 数据 库 实施 阶段 

选择 具体 的 数据 库 管理 系统 ,建立 数据 库 , 组 织 数据 入 库 。 
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6. 数据 库 运 行 和 维护 阶段 


数据 库 实施 后 投入 正式 运行 ,需要 根据 运行 的 情况 (包括 性 能 .用 户 的 反馈 等 ) 不 断 地 
调整 及 修改 数据 库 , 一 旦 数据 库 出 现 故 障 ,应 及 时 进行 数据 库 恢复 。 

一 般 来 说 ,在 数据 库 应 用 系统 的 设计 过 程 中 ,其 结构 设计 和 行为 设计 是 同时 进行 的 ， 
数据 库 设计 的 同时 也 进行 应 用 系统 的 功能 设计 。 规 范 化 的 设计 过 程 是 分 阶段 的 ,每 个 阶 
段 都 有 需要 完成 的 目标 和 任务 ,每 个 阶段 产生 的 文档 将 会 是 下 一 设计 阶段 的 基础 。 数 据 
库 设计 各 阶段 与 应 用 系统 的 功能 设计 各 阶段 如 图 11. 2 所 示 。 
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概念 结构 设计 | 数据 字典 目 & 月 方案 、 概 图 、 数 据 流 图 系统 概要 设计 
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图 11.2 数据 库 设计 各 阶段 数据 描述 与 应 用 系统 的 功能 设计 各 阶段 


11.2 需求 分 析 

简单 地 说 ,需求 分 析 就 是 分 析 用 户 的 需求 。 只 有 能 正确 反映 用 户 需求 的 分 析 才 可 以 
构建 用 户 满意 的 系统 ,否则 一 切 都 是 徒劳 。 

1. 需求 分 析 的 任务 


需求 分 析 的 任务 是 通过 详细 调查 现实 世界 要 处 理 的 对 象 (如 组 织 、 部 门 、 企 业 等 ), 充 
分 了 解 原 系 统 ( 手 工 系统 或 计算 机 系统 ) 的 工作 概况 ,明确 用 户 的 各 种 需求 ,然后 在 此 基础 
上 确定 新 系统 的 功能 。 新 系统 必须 充分 考虑 今后 可 能 的 扩充 和 改变 ,不 能 仅 按 当前 应 用 
需求 来 设计 数据 库 。 

2. 系统 调查 


(1) 调查 组 织 机 构 情 况 。 了 解 该 组 织 的 部 门 组 成 情况 、 各 部 门 的 职 
(2) 调查 各 部 门 的 业务 活动 情况 。 包括 各 部 门 需要 用 到 的 数据 ,数据 在 名 部 门 之 问 
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的 流动 及 处 理 情况 。 

(3) 获取 用 户 对 系统 的 信息 需求 .处理 要 求 、 完 整 性 和 安全 性 要 求 。 

(4) 确定 系统 的 边界 , 即 确定 哪些 业务 活动 由 计算 机 完成 ,哪些 业务 活动 由 人 工 完成 。 

可 以 采取 多 种 方式 完成 以 上 这 些 调 查 活动 。 如 跟班 作业 、 亲 身 参 加 业务 活动 ; 开 调 查 
会 ,通过 座谈 活动 来 了 解 情况 ;请 专人 介绍 ;询问 , 找 专人 回答 调查 的 问题 ;设计 调查 表 供 
用 户 填写 等 。 


3. 编写 需求 分 析 说 明 书 


完成 系统 调查 后 ,需要 归纳 、 分 析 、 整 理 形成 一 份 文档 说 明 , 即 系统 的 需求 分 析 说 明 
书 。 虽然 需求 分 析 说 明 书 没有 统一 的 规范 ,但 是 大 致 包含 以 下 内 容 。 

(1) 系统 概况 ,包括 系统 的 目标 ,范围 .背景 .历史 和 现状 。 

(2) 系统 的 原理 和 技术 及 对 原 系统 的 改善 。 

(3) 系统 总 体 结构 及 子 系统 结构 说 明 。 

(4) 系统 功能 说 明 。 

(5) 数据 处 理 概 要 、 工 程 体制 和 设计 阶段 划分 。 

(6) 系统 方案 及 技术 经济、 功能 和 操作 上 的 可 行 性 。 

除 此 之 外 ,还 常 包含 软 硬 件 的 规格 指标 、 组 织 结构 图 、 数 据 流 图 、 功 能 模块 图 ,数据 字 
典 等 。 


11.2.1 需求 分 析 的 方法 

在 调查 了 解 用 户 的 需求 后 ,还 需要 分 析 和 抽象 用 户 的 需求 。 用 于 需求 分 析 的 方法 有 多 
种 ,主要 有 自 项 向 下 的 需求 分 析 和 自 底 向 上 的 需求 分 析 两 种 ,如 图 11. 3 和 图 11.4 所 示 。 
需求 
| 


| 





















































需求 | … | 需求 需求 | … | 需求 








图 11.3 自 顶 向 下 的 需求 分 析 





需求 | … | 需求 | … | 需求 |…| 需求 
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图 11.4 自 底 向 上 的 需求 分 析 
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图 中 , 自 顶 向 下 的 分 析 方法 (Structured Analysis,SA) 是 最 简单 实用 的 方法 。 它 从 最 
上 层 的 系统 组 织 机 构 入 手 , 采 用 逐 层 分 解 的 方式 分 析 系 统 ,每 层 都 用 数据 流 图 (Data Flow 
Diagram,DFD) 和 数据 字典 (Data Dictionary,DD) 描 述 。 


11.2.2 数据 流 图 
数据 流 图 是 软件 工程 中 专门 描述 信息 在 系统 中 流动 和 处 理 过 程 的 图 形 化 工具 。 由 于 其 较 


容易 理解 ,因此 是 技术 人 员 和 用 户 之 间 很 好 的 交流 工具 。 使 用 SA 方法 ,任何 一 个 系统 都 可 以 
抽象 为 如 图 11. 5 所 示 , 由 数据 来 源 、 处 理 ,数据 输出 和 数据 存储 表示 ,箭头 表示 数据 流向 。 






































一 一 信息 需求 
数据 存储 
数据 来 源 “| 数据 流 (en 数据 输出 | 一 一 一 处 理 需求 
图 11.5 数据 流 图 
数据 流 图 表达 了 数据 和 处 理 过 程 的 关系 。 越 高 层次 的 数据 库 数据 流 图 越 抽 象 , 越 低 


层次 的 数据 流 图 越 具体 ,为 了 反映 更 详细 的 内 容 , 可 以 将 处 理 功能 分 解 为 若干 子 处 理 ,还 
可 以 将 子 处 理 继续 分 解 ,形成 若干 层次 的 数据 流 图 ,如 图 11.6 所 示 。 
































最 高 层 数 据 流 图 
数据 流 图 1 数据 流 图 2 / 数据 流 图 n / 
































数据 流 图 | V/A … / 钱 据 流 图 1.p/ /分 据 流 图 :1 … _/ 煞 据 流 图 mg 


数据 流 图 1. 1. 1 2 / 煞 据 流 图 .1.7/ 


图 11.6 多 层次 数据 流 图 


数据 流 图 主要 由 数据 流 ,数据 存储 (或 数据 文件 ) ,数据 处 理 (或 加 工 ) 、 数 据 的 源 点 和 
终点 4 种 要 素 构成 ,其 中 数据 流 用 箭头 表示 ,其 他 元 素 的 表示 符号 如 图 11.7 所 示 。 

数据 流 是 数据 在 系统 内 的 传播 路 径 ,一般 用 名 词 或 者 名 词 短语 命名 , 它 由 一 组 固定 的 
数据 项 (如 教师 由 教师 编号 、 姓 名 、 性 别 、 职 称 等 构成 ) 组 成 ,在 加 工 之 间 、 加 工 与 数据 源 点 
之 间 、 加 工 与 数据 存储 之 间 流 动 。 

数据 存储 (或 数据 文件 ) 指 保存 数据 的 数据 库 文件 。 流 向 数据 存储 的 数据 流通 常 可 理 
解 为 写 和 文件 或 者 查询 文件 ,从 数据 存储 流出 则 可 理解 为 读 取 数 据 或 者 得 到 查询 结果 , 除 
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Oe 
I 
或 数据 存储 


图 11.7 数据 流 图 的 符号 


了 图 11.7 的 表示 方法 外 ,还 可 以 用 "一 横 线 ?来 表示 数据 文件 。 

数据 处 理 (或 加 工 ) 指 对 数据 流 进行 操作 或 变换 ,一 般 用 动词 或 者 动词 短语 表示 其 名 
字 , 描 述 完成 什么 加 工 。 

数据 的 源 点 和 终点 ,为 系统 的 外 部 环境 实体 ,如 人 员 组织 或 者 其 他 软件 系统 ,一般 只 
出 现在 数据 流 图 的 顶层 图 中 。 


1. 画 数据 流 图 的 步骤 


第 一 步 : 首先 画 顶 层 数据 流 图 。 它 表示 系统 有 哪些 输入 数据 ,经 过 一 个 加 工 后 ,其 终 
点 到 哪里 去 。 如 图 11. 8 所 示 的 图 书馆 借 书 还 书 系统 顶层 数据 流 图 ,读者 向 图 书 管理 员 发 
出 借 书 或 者 还 书 的 请 求 , 交 由 系统 处 理 完 请 求 ,结果 发 回 给 图 书 管理 员 。 


图 书 管理 员 CD 图 书 管理 员 


11.8 图 书馆 借 书 还 书 系统 顶层 数据 流 图 


























第 二 步 : 画 下 一 层 的 数据 流 图 。 按 照 自 项 向 下 .由 外 向 内 的 方法 把 一 个 系统 分 解 为 
多 个 子 系统 ,为 其 画 子 数据 流 图 ,而 每 层 数 据 流 图 中 的 加 工 还 可 以 继续 再 分 解 为 更 具体 细 
致 的 下 一 层 数据 流 图 ,直到 不 能 分 解 为 止 。 图 书馆 借 书 还 书 系统 主要 由 借 书 管理 和 还 书 
管理 两 个 主要 功能 构成 ,上 面 的 顶层 数据 流 图 分 解 为 图 11.9, 而 借 书 管理 和 还 书 管理 又 
可 以 继续 细 化 ,其 细 化 后 的 下 层 数据 流 图 如 图 11. 10 所 示 。 借 书 管理 细 化 为 借 书 查找 和 
结束 登记 , 借 书 查找 需要 的 数据 来 自 读者 文件 和 图 书 文件 ,而 借 书信 息 最 终 需 要 保存 到 借 
书 文件 中 ;还 书 管理 细 化 为 还 书 查找 、 罚 款 处 理 、 还 书 处 理 , 还 书 查找 需要 查看 借 书 文件 ， 
还 书 完成 后 需要 修改 借 书 文件 和 图 书 文件 。 


2. 画 数据 流 图 的 注意 事项 


(1) 图 中 的 每 个 元 素 都 应 该 有 名 字 。 
(2) 每 个 加 工 至 少 有 一 个 输入 数据 流 和 一 个 输出 数据 流 。 
(3) 需要 编号 。 当 把 上 层 数 据 流 图 的 某 个 加 工分 解 为 男 一 张 数 据 流 图 时 , 则 上 层 数 





198 











数据 库 设计 






罚款 单 





图 11.9 图 书 借 还 系统 一 层 数据 流 图 


借 书 单 _。/ 2.1 借 书 )、_ 借 书 单 2.2 结 束 
查找 登记 
借 书 文件 


图 书 文件 
过 期 罚款 单 





读者 文件 









借 书记 录 ，/ 3.2 罚 款 、 借 书记 录 
处 理 









图 书 文件 


借 书 文件 
图 11.10 图 书 借 还 系统 底层 数据 流 图 


据 流 图 为 父 图 ,下 层 数据 流 图 为 子 图 , 父 图 和 子 图 都 应 该 有 相应 的 编号 。 如 果 父 图 加 工 编 


号 为 1, 则 子 图 的 每 个 加 工 的 编号 的 构成 应 该 是 1. 1,1. 2,1.3,…',1.7。 
(4) 任何 一 个 子 数据 流 图 都 必须 与 它 上 一 层 的 一 个 加 工 对 应 ,两 者 的 输入 数据 流 和 
输出 数据 流 必 须 一 致 , 即 必 须 保 持平 衡 。 
图 11. 11 为 学 生 选 课 数据 流 图 ,主要 由 学 生 选 课 .成 绩 登录 .打印 成 绩 单 .打印 选课 单 
4 个 加 工 构成 ,涉及 学 生 .课程 .学 生 选 课 3 个 数据 存储 文件 。 
























学 生 课程 学 生 选 课 
(student) (course) (sc) 
% 加/ 可 of 葛 
ww 此 并 多 物 多 -多 入 广 委 
六 
学 生 选 课 印 成 绩 单 成 绩 登 录 打印 选课 单 
人 人 人 人 
六 党 六 
学 生 成 绩 单 教师 选课 名 单 




















11.11 学 生 选 课 数据 流 图 
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数据 流 图 表达 了 数据 和 处 理 的 关系 ,并 没有 对 各 个 数据 流 、 加 工 处 理 、 数 据 文件 存储 
进行 详细 说 明 ,数据 流 和 数据 文件 的 名 字 并 不 能 详细 说 明 其 组 成 成 分 和 数据 特性 ,而 加 工 
处 理 也 不 能 反映 其 过 程 。 


11.2.3 数据 字典 


数据 字典 是 系统 中 数据 的 详细 描述 ,用 来 定义 数据 流 图 中 各 个 成 分 的 具体 含义 ,是 各 
类 数据 结构 和 属性 的 清单 ,是 需求 分 析 的 重要 成 果 。 它 在 需求 分 析 阶 段 通常 包括 数据 项 、 
数据 结构 ,数据 流 ,数据 存储 和 处 理 过 程 5 个 部 分 。 

数据 项 是 数据 不 可 再 分 的 数据 单位 ,一 般 包含 数据 项 名 、 含 义 说 明 、 别 名 、 数 据 类 型 、 
长 度 、 取 值 范围 . 取 值 含义 ,与 其 他 数据 项 的 关系 。 

数据 结构 是 数据 项 有 意义 的 集合 ,内 容 包 括 数据 结构 名 称 、 含 义 说 明 ,数据 项 名 。 

数据 流 表示 数据 在 系统 内 传输 的 路 径 , 可 以 是 数据 项 ,也 可 以 是 数据 结构 。 它 主要 包 
括 数据 流 名 ,说 明 数据 流 来 源 、 数 据 流 去 向 ,组 成 平均 流量 、 高 峰 期 流量 。 

数据 存储 是 数据 结构 停留 或 保存 的 地 方 ,也 是 数据 流 的 来 源 和 去 向 之 一 。 它 主要 包 
括 存 储 名 、 说 明 ,编号 ,流入 的 数据 流 ,流出 的 数据 流 、 组 成 ,数据 量 、 存 取 方 式 。 

处 理 过 程 的 处 理 钠 辑 一 般 用 判定 表 或 判定 树 来 描述 。 数 据 字典 只 用 来 描述 处 理 过 程 
的 说 明 性 信息 ,包括 名 称 、 说 明 、 输 入 数据 流 、 输 出 数据 流 、 处 理 。 

例如 ,为 学 生 选课 数据 流 图 定义 数据 字典 。 

(1) 数据 项 : 以 “课程 号 ”为 例 。 

数据 项 名 : 课程 号 。 

数据 项 含义 : 唯一 标识 每 门 课程 。 

别名 : 课程 编号 。 

数据 类 型 : 字符 型 。 

长 度 : 8。 

取 值 范围 : 00000 一 99999 。 

与 其 他 数据 项 的 逻辑 关系 : (无 ) 。 

(2) 数据 结构 : 以 “课程 ”为 例 。 

数据 结构 名 : 课程 。 

含义 说 明 : 定义 了 一 个 课程 的 有 关 信 息 。 

数据 项 名 : 课程 号 .课程 名 、 学 分 。 

(3) 数据 流 : 以 “成 绩 信 息 ” 为 例 。 

数据 流 名 : 成 绩 信息 。 

说 明 : 学 生 所 选课 程 的 成 绩 。 

数据 流 来 源 : 成 绩 登 录 处 理 。 

数据 流 去 向 : 学 生 选 课 存储 。 

组 成 : 学 号 .课程 号 成绩 。 

平均 流量 : 每 天 50 个 。 
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高 峰 期 流量 : 每 天 200 个 。 

(4) 数据 存储 : 以 “课程 ”为 例 。 

数据 存储 名 : 课程 。 

说 明 : 记录 学 校 开 设 的 所 有 课程 。 
编号 : 无 。 

流入 的 数据 流 : 无 。 

流出 的 数据 流 : 课程 信息 。 

组 成 : 课程 号 ,课程 名 、 学 分 。 
数据 量 : 600 个 记录 。 

存 取 方式 : 随机 存 取 。 

(5) 处 理 过 程 : 以 “打印 成 绩 单 ”为 例 。 
处 理 过 程 名 : 打印 成 绩 单 。 

说 明 : 教师 和 学 生 都 可 以 打印 成 绩 单 。 
输入 数据 流 : 成 绩 信息 、 学 号 信息 。 
输出 数据 流 : 输入 的 学 号 及 其 成 绩 。 
处 理 : 连接 打印 机 、 打 印 成 绩 单 。 


11.3 概念 结构 设计 


在 前 面 的 需求 分 析 阶 段 ,设计 人 员 已 经 充分 调查 并 描述 了 用 户 的 需求 ,但 这 些 需求 是 
现实 世界 的 具体 要 求 , 把 这 些 需 求 抽象 为 信息 世界 的 表达 ,才能 更 好 地 实现 用 户 的 需求 。 
概念 结构 设计 就 是 将 需求 分 析 得 到 的 用 户 需 求 抽象 为 信息 结构 , 即 概念 模型 。 概 念 模型 
独立 于 任何 计算 机 系统 ,并 可 以 转换 为 计算 机 上 任 一 DBMS 支持 的 特定 的 数据 模型 。 人 
们 提出 了 很 多 概念 模型 ,其 中 最 著名 的 一 种 是 E-R 模型 , 它 将 现实 世界 的 信息 结构 统一 
用 实体 、 属 性 及 实体 间 的 联系 来 描述 。 


11.3.1 概念 模型 的 特点 


概念 模型 作为 概念 结构 设计 的 表达 工具 ,是 连接 需求 分 析 和 数据 库 逻 辑 结 构 的 桥梁 。 
它 应 具备 以 下 特点 。 

(1) 概念 模型 可 以 真实 地 反映 现实 世界 ,表达 用 户 的 各 种 需求 ,包括 事物 和 事物 之 间 
的 联系 及 用 户 对 数据 的 处 理 要 求 。 

(2) 概念 模型 应 易于 理解 和 交流 。 概 念 模型 是 DBA 应 用 开发 人 员 和 用 户 之 间 交 流 
的 主要 界面 。 因 此 ,概念 模型 要 表达 自然 .直观 和 容易 理解 ,以 便 和 不 熟悉 计算 机 的 用 户 
交换 意见 ,用 户 的 积极 参与 是 保证 数据 库 设 计 成 功 的 关键 。 

(3) 概念 模型 易于 修改 和 扩充 ,能 够 随 着 用 户 的 需求 和 现实 环境 的 变化 而 改变 。 

(4) 概念 模型 易于 向 各 种 数据 模型 转化 。 概 念 模型 独立 于 特定 的 DBMS, 因而 更 加 
稳定 ,能 方便 地 向 关系 模型 、 网 状 模型 .层次 模型 .面向 对 象 模型 等 各 种 数据 模型 转化 。 
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11.3.2 概念 结构 设计 方法 


根据 实际 情况 的 不 同 ,E-R 模型 的 设计 一 般 有 以 下 4 种 方法 。 
1. 自 项 向 下 
首先 定义 全 局 概念 结构 的 框架 ,再 逐步 求 精细 化 ,如 图 11. 12 所 示 。 





全 局 概念 模式 


ee 


概念 模式 1 和 概念 模式 
































概念 模式 1. 1 | … | 概念 模式 1.n 概念 模式 n. 1 | … | 概念 模式 n.m 


11.12 自 顶 向 下 策略 


2. 自 底 向 上 


首先 定义 各 局 部 应 用 的 概念 结构 ,然后 再 将 各 局 部 概念 结构 集成 为 全 局 概念 结构 ,如 
图 11.13 所 示 。 


















































概念 模式 1. 1 党 概念 模式 1. 7 … “| 概念 模式 n. 1 a 概念 模式 n. m 
概念 模式 1 概念 模式 




















图 11.13 自 底 向 上 策略 


3. 逐步 扩张 


先 定义 最 重要 的 核心 概念 结构 ,然后 再 向 外 扩张 ,以 滚雪球 的 方式 逐步 生成 其 他 概 
念 ,直至 总 体 概念 结构 ,如 图 11. 14 所 示 。 


将 自 顶 向 下 和 自 底 向 上 相 结 合 ,用 自 项 向 下 策略 设计 一 个 全 局 概念 结构 的 框架 ,以 它 
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11.14 逐步 扩张 策略 


为 骨架 集成 由 自 底 向 上 策略 中 涉及 的 各 局 部 概念 结构 。 
经 常 采用 自 项 向 下 的 需求 分 析 , 然 后 再 采用 自 底 向 上 的 概念 结构 设计 ,如 图 11. 15 
所 示 。 




























































































T 
需求 分 析 
( 自 项 向 下 ) 

需求 1.1 ( 需求 .2 】 … ( 需求 m1 】 需求 n.2 
1 
人 
概念 模式 1. 1| 。 | 概念 模式 1. 2| 。… | 概念 模 式 w 1| | 概 全 模式 .2 
概念 结构 设计 wy 
( 自 底 向 上 ) 概念 模式 1 概念 模式 
全 局 概念 模式 
1 


11.15 自 顶 向 下 的 需求 分 析 与 自 底 向 上 的 概念 结构 设计 


这 里 只 介绍 自 底 向 上 的 概念 结构 设计 方法 ,首先 抽象 数据 并 进行 局 部 概念 模型 (分 
E-R 图 ) 设 计 , 再 集成 局 部 E-R 图 ,得 到 全 局 概念 模型 (全 局 ER 图 \ 综 合 E-R 图 ) 设 计 , 如 
图 11. 16 所 示 , 这 两 步 过 程 都 需要 征求 用 户 意 见 。 

11.3.3 局 部 概念 模型 设计 


设计 局 部 ER 图 ,具体 要 完成 下 列 3 个 任务 : 选择 局 部 应 用 、 对 每 个 局 部 应 用 进行 数 
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图 11.16 自 底 向 上 的 E-R 设计 方法 的 步骤 
据 抽 象 .逐一 设计 各 局 部 E-R 图 。 
1. 选择 局 部 应 用 


根据 前 面 需求 分 析 得 到 的 结果 (如 数据 流 图 .数据 字典 等 ) ,在 多 层 数据 流 图 中 选择 一 
个 适当 层次 的 数据 流 图 ,作为 ER 图 的 出 发 点 。 人 们 往往 以 中 层 数据 流 图 作为 设计 分 ER 
图 的 依据 。 


2. 对 每 个 局 部 应 用 进行 数据 抽象 


在 前 面 选择 好 局 部 应 用 之 后 ,每 个 局 部 应 用 都 对 应 了 一 组 数据 流 图 ,而 其 所 涉及 的 数 
据 信息 都 保存 在 数据 字典 中 ,结合 数据 流 图 与 数据 字典 的 信息 ,抽象 出 局 部 应 用 对 应 的 实 
体 类 型 .属性 、 实 体 间 的 联系 。 一 般 来 说 ,“ 数 据 结 构 ”“ 数 据 存储 ”对 应 实体 ,而 其 组 成 的 数 
据 项 对 应 属性 ,处 理 对 应 联系 。 

数据 抽象 就 是 将 需求 分 析 阶 段 收集 到 的 数据 进行 分 类 、 组 织 , 从 而 形成 信息 世界 的 实 
体 、 属 性 、 实 体 间 的 联系 。 

数据 抽象 主要 有 分 类 (classification)、 聚 集 (aggregation)、 概 括 (generalization)3 种 
方法 。 

分 类 ,定义 某 一 类 概念 作为 现实 世界 中 一 组 对 象 的 类 型 。 这 些 对 象 具 有 某 些 共同 的 
特性 和 行为 。 它 抽象 了 值 和 型 之 间 的 is a member of 的 语 
义 。 实 体型 就 是 实体 的 抽象 。 实 体型 “教师 ”就 是 对 实体 | 教 
“ 张 音 、 刘 晓 , 陈 笑 、 李 超 ” 的 抽象 ,表示 “ 张 音 、 刘 晓 、 陈 笑 、 is a member of 
李 超 ” 是 “教师 ”实体 型 中 的 一 员 。 其 共同 的 特性 和 行为 
是 : 在 某 个 院 系 教授 某 些 课程 ,如 图 11. 17 所 示 。 

聚集 ,定义 了 某 一 类 型 的 组 成 成 分 。 它 抽象 了 对 象 内 
部 类 型 和 成 分 之 间 的 is a part of 的 语义 。 在 E-R 模型 中 ， 
实体 型 就 是 阁 干 属性 组 成 的 。 实 体型 “专职 教师 ”就 是 属性 “职工 编号 ,姓名 性别、 职称 、 
专业 、 所 在 院 系 ”的 抽象 ,表示 “专职 教师 ”实体 型 是 由 “职工 编号 、 姓 名、 性 别 、 职 称 、 专 业 、 
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所 在 院 系 ? 组 成 的 ,如 图 11. 18 所 示 。 


专职 教师 


is apart of 





职工 编号 姓名 性 别 职称 专业 所 在 院 系 









































11.18 聚集 
概括 ,定义 类 型 之 间 的 一 种 子 集 联系 。 它 抽象 了 类 型 之 间 的 is a subset of 的 语义 。 在 
ER 模型 中 ,实体 型 “ 教 职 工 ” 就 是 对 “专职 教师 ”和 “行政 管理 人 员 ” 的 抽象 。 实 体型 “ 教 职 
工 ” 为 超 类 或 父 类 ,实体 型 “专职 教师 "和 “行政 管理 人 员 ” 称 为 子 类 ,如 图 11. 19 所 示 。 





超 类 一 一 一 | 教 职 工 











is a subset of 














子 类 一 一 | 专职 教师 行政 管理 人 员 
图 11.19 概括 








3. 逐一 设计 各 局 部 E-R 


根据 每 个 局 部 应 用 对 应 的 数据 字典 (DD) 及 数据 流 图 CDFD) ,逐一 确定 每 个 局 部 应 用 
的 实体 类 型 .联系 类 型 ,组 合成 E-R 图 ,并 确定 实体 类 型 及 联系 类 型 的 属性 ,以 及 确定 实 
体 类 型 的 键 。 


11.3.4 全 局 概念 模型 设计 
局 部 E-R 模型 设计 好 后 ,下 一 步 就 是 集成 各 局 部 E-R 模型 ,形成 全 局 E-R 模型 。 集 


成 的 方法 有 两 种 。 
(1) 多 元 集成 法 。 一 次 性 将 多 个 局 部 ER 图 合并 为 一 个 全 局 ER 图 ,如 图 11. 20 所 示 。 




































































局 部 E-R 图 1 局 部 E-R 图 2 | … | 局 部 E-R 图 n 
J | Wa 
初步 E-R 图 
1 
基本 E-R 图 
1 
优化 的 E-R 图 














图 11.20 多 元 集成 法 
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(2) 二 元 集成 法 。 首 先 集成 两 个 重要 的 局 部 E-R 图 ,再 用 累加 的 方法 逐步 将 剩余 的 
局 部 E-R 图 集成 进来 ,如 图 11. 21 所 示 。 





| 局 部 E-R 图 1 局 部 E-R 图 2 


ws 


合并 E-R 图 1 和 2 局 部 E-R 图 
1 1 
初步 ER 图 


1 
基本 E-R 图 


1 
优化 的 E-R 图 
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图 11.21 二 元 集成 法 


无 论 采用 哪 种 方法 进行 集成 ,形成 全 局 E-R 图 都 有 以 下 3 个 步骤 。 

步骤 一 : 合并 所 有 分 E-R 图 ,形成 初步 的 全 局 E-R 图 。 

步骤 二 : 消除 冲突 ,形成 基本 的 全 局 E-R 图 。 

各 个 局 部 应 用 对 应 的 局 部 E-R 图 不 都 是 由 同一 个 设计 者 设计 的 ,这 就 造成 了 各 个 分 
E-R 图 中 必然 会 出 现 很 多 不 一 致 的 地 方 ,这 种 情况 称 为 冲突 。 合 理 地 消除 这 些 冲突 ,是 形 
成 基本 全 局 E-R 图 的 关键 工作 。 主 要 有 以 下 几 种 冲突 。 

1) 属性 冲突 

属性 冲突 分 为 属性 域 冲突 和 属性 取 值 单位 冲突 。 属 性 域 冲突 即 属性 值 的 类 型 、 取 值 范 
围 或 取 值 集合 不 同 。 例 如 教师 编号 ,不 同 的 设计 者 可 能 用 不 同 的 编码 方式 ,有 的 用 整数 ,有 
的 用 字符 型 。 又 如 性 别 , 有 的 设计 者 用 “ 男 "或 者 * 女 ”, 有 的 设计 者 用 f 或 者 m。 对 于 取 值 单 
位 的 冲突 ,如 计量 单位 商品 的 重量 ,有 的 可 能 以 千克 为 单位 ,而 有 可 能 以 斤 为 单位 。 

2) 命名 冲突 

命名 冲突 分 为 异 名 同 义 和 同名 异 义 。 异 名 同 义 是 指 同一 实体 或 属性 在 不 同 的 局 部 
E-R 图 中 的 名 字 不 同 。 同 名 异 义 是 指 相同 的 名 字 在 不 同 的 局 部 E-R 图 中 是 指 不 同 实体 
或 者 属性 。 

处 理 命名 冲突 和 属性 冲突 可 以 通过 讨论 和 协商 的 手段 解决 。 

3) 结构 冲突 

结构 冲突 , 即 同一 对 象 在 不 同 的 局 部 E-R 图 中 分 别 被 作为 实体 和 属性 。 例 如 ,教师 
在 某 一 局 部 E-R 图 中 当 作 实体 ,而 在 另 一 局 部 E-R 图 中 却 当 作 属 性 。 应 该 将 其 统一 为 实 
体 或 者 统一 为 属性 。 

同一 实体 在 不 同 的 局 部 ER 图 中 包含 的 属性 个 数 和 属性 排列 顺序 不 同 。 这 是 由 于 不 
同 的 局 部 应 用 关注 的 是 实体 的 不 同 侧面 。 解 决 方法 是 取 该 实体 在 各 分 ER 图 中 的 并 集 。 

实体 型 之 间 的 联系 在 不 同 局 部 E-R 图 中 为 不 同 的 类 型 ,如 实体 El 和 实体 E2 在 某 局 
部 E-R 图 中 为 一 对 一 的 联系 ,而 在 另外 的 分 E-R 图 中 却 为 一 对 多 的 联系 ,有 可 能 还 存在 
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E1、E2、E3 3 个 实体 间 有 联系 。 解决 方法 是 根据 应 用 进行 综合 和 调整 。 例 如 ,在 图 11. 22 
中 ,零件 与 产品 之 间 存 在 多 对 多 的 “构成 ?联系 ,产品 .零件 与 供应 商 三 者 之 间 还 存在 多 对 
多 的 “供应 ”联系 ,这 两 个 联系 不 能 相互 包含 ,在 合并 时 应 该 将 它们 综合 起 来 。 
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图 11.22 合并 两 个 分 E-R 图 


步骤 三 : 消除 不 必要 的 元 余 , 形 成 优化 的 全 局 E-R 图 。 

获得 了 基本 的 全 局 ER 图 后 ,还 可 能 存在 宛 余 的 数据 和 宛 余 的 联系 。 宛 余 的 数据 是 
指 可 由 基本 数据 导出 的 数据 。 宛 余 的 联系 是 指 可 由 其 他 联系 导出 的 联系 。 宛 余 的 数据 和 
联系 容易 破坏 数据 库 的 完整 性 ,给 数据 库 的 维护 造成 困难 ,应 当 于 以 消除 。 

一 般 根 据 数据 流 图 和 数据 字典 中 数据 项 之 间 的 逻辑 关系 来 消除 宛 余 。 

但 是 ,在 优化 的 过 程 中 ,不 是 所 有 的 元 余数 据 和 联系 都 需要 被 消除 。 有 时 为 了 提高 系 
统 效率 ,以 保留 元 余 的 数据 和 联系 为 代价 。 到 底 是 保留 ,还 是 消除 宛 余 信息 ,设计 者 需要 
根据 用 户 的 要 求 在 存储 空间 ,访问 效率 维护 代 价 之 间 进 行 权衡 。 

例如 ,在 简单 的 教务 管理 系统 中 有 如 下 语义 约束 。 

(1) 一 个 学 生 可 选修 多 门 课程 ,一 门 课程 可 被 多 个 学 生 选 修 。 

(2) 一 个 教师 可 讲授 多 门 课程 ,一 门 课程 可 由 多 个 教师 讲授 。 

(3) 一 个 系 可 有 多 个 教师 ,一 个 教师 只 能 属于 一 个 系 ; 系 和 学 生 也 存在 同样 的 联系 。 

根据 上 述 约定 可 以 得 到 图 11. 23 所 示 的 学 生 选 课 局 部 E-R 图 和 图 11. 24 所 示 的 教 
师 授课 局 部 E-R 图 。 


















































系 ! 开课 
4 一 | 半生 u 八 从 课 E | (人 伐 几 屿 


图 11.23 学 生 选 课 局 部 ER 
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11.24 教师 授课 局 部 E-R 图 








把 上 面 两 个 局 部 E-R 图 合并 ,消除 冲突 形成 基本 的 全 局 E-R 图 ,如 图 11. 25 所 示 。 
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图 11.25 教务 管理 系统 的 基本 全 局 E-R 














在 前 面 的 基本 全 局 ER 图 中 ,学 生 的 “平均 成 绩 ” 属 于 元 余 属 性 , 它 可 以 由 “选修 ”联系 中 的 
属性 “成 绩 ” 计 算出 来 ,而 课程 实体 的 “教师 号 "也 可 以 由 “讲授 "联系 推导 出 来 ,如 图 11. 26 所 示 。 
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图 11.26 教务 管理 系统 的 优化 的 全 局 ER 图 
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除 此 之 外 “ 系 ? 和 "课程 ”之 间 的 "开课 ?联系 可 以 由 * 系 "和 "教师 ”的 “属于 "联系 及 "教师 "和 
“课程 "之 间 的 “讲授 "联系 推导 出 来 。 教 务 管理 系统 的 最 终 的 全 局 ER 图 如 图 11. 27 所 示 。 
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图 11.27 教务 管理 系统 的 最 终 的 全 局 E-R 图 


11.4 ”人 逻辑 结构 设计 


概念 模型 是 独立 于 任何 DBMS 数据 模型 的 信息 结构 。 风 辑 结 构 设计 的 任务 是 将 概 
念 结构 设计 阶段 完成 的 全 局 E-R 模型 转换 为 DBMS 支持 的 数据 模型 。 它 一 般 分 为 3 个 

第 一 步 : 将 概念 结构 转换 为 一 般 的 关系 、 网 状 、 层 次 ,或 者 面向 对 象 等 其 他 数据 模型 。 

第 二 步 : 将 转换 来 的 关系 、 网 状 、 层 次 或 者 面向 对 象 等 其 他 数据 模型 进行 优化 。 

第 三 步 : 设计 用 户 子 模式 。 

目前 市 场 上 流行 的 商品 化 的 DBMS 大 部 分 都 是 关系 型 数据 库 管理 系统 (RDBMS)， 
因此 这 里 只 介绍 ER 模型 到 关系 模型 的 转化 。 


11.4.1 E-R 模型 到 关系 模型 的 转换 


E-R 模型 是 由 实体 型 属性、 联系 构成 的 ,而 关系 模型 是 关系 模式 的 集合 ,因此 将 ER 
模型 转换 为 关系 模型 ,实质 就 是 将 实体 型 .属性 、 联 系 转换 为 相应 的 关系 模式 。 其 转换 规 
则 已 经 在 第 6 章 中 讲述 ,这 里 不 再 重复 。 


11.4.2 关系 模型 的 优化 


对 上 一 步 获 得 的 关系 模型 进行 优化 ,由 于 E-R 模型 到 关系 模型 的 转换 规则 不 唯一 ， 
因此 获得 的 关系 模型 并 不 唯一 ,为 了 进一步 提高 数据 库 应 用 系统 的 性 能 ,还 应 该 根据 实际 
的 应 用 适当 地 修改 、 调 整数 据 模型 的 结构 。 

关系 模型 的 优化 通常 以 规范 化 理论 为 指导 ,方法 如 下 。 
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(1) 确定 数据 依赖 。 根 据 数据 字典 中 描述 的 需求 分 析 得 到 的 语义 ,分 别 确定 每 个 关 
系 模式 内 部 各 属性 之 间 的 数据 依赖 ,以 及 不 同 关系 模式 之 间 的 数据 依赖 。 

(2) 按照 数据 依赖 的 理论 对 关系 模式 逐一 进行 分 析 , 考 察 是 否 存 在 部 分 函数 依赖 、 传 
递 函数 依赖 ,多 值 依赖 等 ,确定 各 关系 模式 分 别 属于 第 几 范式 。 

(3) 利用 规范 化 理论 对 各 关系 模式 按照 应 用 要 求 进行 分 解 ,注意 保持 函数 依赖 和 无 
损 连 接 性 。 

(4) 为 了 提高 系统 运行 效率 和 节约 存储 空间 ,进一步 调整 关系 模式 。 

关系 模型 的 优化 还 应 考虑 尽量 减少 连接 运算 ,在 数据 库 的 各 运算 中 ,连接 运算 的 代价 
是 最 高 的 ,因此 ,如 果 在 应 用 中 经 常 对 关系 模式 Rl1 和 关系 模式 R2 进行 连接 运算 ,可 以 考 
虑 对 关系 R1 或 者 R2 进行 增加 元 余 属 性 \ 派 生 属 性 ,或 者 合并 关系 Rl1 和 R2。 

关系 模型 的 优化 还 须 调 整 关系 实例 的 大 小 。 关 系 实例 本 身 的 大 小 对 查询 速度 也 会 产 
生 影响 。 在 某 些 情况 下 将 一 个 关系 分 解 为 若干 个 较 小 的 关系 可 能 更 有 利 。 其 中 一 种 分 害 
方法 为 水 平分 割 ,如 学 生 关系 ,可 以 将 全 校 的 学 生 数 据 放 在 一 个 关系 表 中 ,也 可 以 按照 院 
系 分 别 建立 学 生 关系 ,使 得 每 个 关系 的 数据 量 在 一 个 合理 的 水 平 ; 另 一 种 分 制 方法 为 垂直 
分 割 , 即 按照 属性 进行 分 割 , 当 某 个 关系 模式 中 包含 的 属性 太 多 时 ,可 以 考虑 把 常用 属性 
和 非常 用 属性 分 开 ,形成 相应 的 两 个 关系 表 , 提 高 查询 效率 。 





11.4.3 设计 用 户 子 模式 


将 全 局 E-R 图 转化 为 全 局 逻辑 模型 后 ,还 应 该 根据 局 部 应 用 需求 设计 用 户外 模式 。 
利用 视图 设计 符合 局 部 用 户 需要 的 外 模式 ,主要 包括 以 下 两 个 方面 。 

(1) 可 以 对 不 同 级 别 的 用 户 定义 不 同 的 视图 ,以 保障 系统 的 安全 性 。 

(2) 某 些 局 部 应 用 中 经 常 要 使 用 一 些 很 复杂 的 查询 ,可 以 为 这 些 复杂 的 查询 定义 
视图 。 


11.5 物理 结构 设计 





数据 库 在 物理 设备 上 的 存储 结构 与 存 取 方 法 称 为 数据 库 的 物理 结构 , 它 依赖 于 选 定 
的 数据 库 管理 系统 。 为 一 个 给 定 的 逻辑 数据 模型 选取 一 个 最 适合 应 用 要 求 的 物理 结构 的 
过 程 ,就 是 数据 库 的 物理 设计 。 

数据 库 的 物理 设计 通常 分 为 两 步 。 

(1) 确定 数据 库 的 物理 结构 ,主要 是 指 存 取 方 法 和 存储 结构 。 

(2) 对 物理 结构 进行 评价 ,主要 是 评价 物理 结构 的 时 间 和 空间 效率 。 

如 果 评 价 结果 满足 设计 要 求 , 则 可 以 进入 物理 实施 阶段 ,否则 需要 重新 设计 或 者 修改 
物理 结构 ,有 时 甚至 还 需要 返回 到 前 面 的 阶段 进行 修改 。 

每 个 数据 库 管理 系统 提供 的 物理 环境 、 存 取 方法 和 存储 结构 不 一 致 ,因此 要 想 设计 出 
符合 给 定 要 求 的 物理 结构 ,需要 熟悉 数据 库 管理 系统 提供 的 存 取 方法 和 存储 结构 , 除 此 之 
外 ,还 要 了 解 用 户 对 各 种 事务 运行 时 的 响应 时 间 、 存 储 空间 利用 率 的 要 求 。 例 如 ,需要 了 
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解 以 下 内 容 。 

(1) 对 于 数据 库 查询 事务 ,需要 得 到 如 下 信息 。 

。 查询 的 关系 。 

。 查询 条 件 涉及 的 属性 。 

。 连接 条 件 涉及 的 属性 。 

。 查询 的 投影 属性 。 

(2) 对 于 数据 更 新 事务 ,需要 得 到 如 下 信息 。 

。， 被 更 新 的 关系 。 

。 每 个 关系 上 的 更 新 操作 条 件 涉及 的 属性 。 

。 修改 操作 要 改变 的 属性 值 。 

还 需要 知道 每 个 事务 在 各 关系 上 运行 的 频率 和 性 能 要 求 , 如 一 个 事务 可 能 需要 在 5s 
内 运行 完 ,如 更 新 事务 经 常 发 生 时 ,就 应 该 考虑 不 需要 创建 索引 。 


11.5.1 存 取 方法 


存 取 方法 是 快速 存 取 数据 库 中 数据 的 技术 。 数 据 库 管理 系统 中 提供 的 存 取 方法 主要 
有 索引 存 取 法 、 聚 徐 存 取 方 法 \ 哈 希 (Hash) 存 取 方 法 。 


1. 索引 存 取 法 


索引 存 取 法 有 多 种 ,如 位 图 索引 、 函 数 索 引 、B+ 树 索引 ,其 中 使 用 最 多 的 是 B+ 树 索 
引 。 索 引 方法 实际 上 就 是 根据 应 用 要 求 确定 在 哪些 关系 的 哪些 属性 上 建立 索引 。 一 般 考 
虑 在 如 下 情况 建立 索引 。 

(1) 经 常 在 查询 条 件 中 出 现 的 属性 上 建立 索引 。 

(2) 经 常 在 连接 操作 中 的 连接 条 件 出 现 的 属性 上 建立 索引 。 

(3) 如 果 一 个 属性 经 常 作为 最 大 值 和 最 小 值 等 聚集 函数 的 参数 , 则 考虑 在 这 个 属性 
上 建立 索引 。 

当 数据 量 大 而 且 数据 库 的 查询 很 频繁 时 ,索引 可 以 极 大 地 加 快 查询 效率 。 但 是 ,并 不 
是 索引 越 多 越 好 ,因为 维护 索引 需要 代价 。 当 数据 库 有 比较 多 的 更 新 事务 时 ,不 应 该 建立 
太 多 的 索引 。 


2. 聚 簇 存 取 方 法 


为 了 提高 某 个 属性 (或 属性 组 ) 的 查询 速度 ,把 这 个 或 者 这 些 属性 上 具有 相同 值 的 元 
组 集中 存放 在 连续 的 物理 块 中 称 为 聚 徐 。 该 属性 (或 属性 组 ) 称 为 聚 簇 码 。 

聚 簇 功能 可 以 大 大 提高 按 聚 簇 码 进行 查询 的 效率 。 例 如 ,要 查询 数学 系 的 所 有 学 生 
名 单 , 设 该 系 有 1000 名 学 生 ,在 极端 情况 下 ,该 1000 名 学 生 对 应 的 数据 元 组 分 布 在 1000 
个 不 同 的 物理 块 上 。 尽 管 对 学 生 关系 已 经 按照 所 在 系 建 有 索引 ,根据 索引 很 快 找到 数学 
系 学 生 的 元 组 地 址 ,避免 了 全 表 扫 描 , 但 是 根据 元 组 地 址 访问 数据 块 时 就 要 存 取 1000 个 
物理 块 ,执行 1000 次 IO 操作 。 如 果 将 同一 系 的 学 生 元 组 集中 存放 , 则 每 读 一 个 物理 块 








211 











数据 库 原理 及 应 用 


可 得 到 多 个 满足 查询 条 件 的 元 组 ,从 而 显著 地 减少 了 访问 磁盘 的 次 数 。 

聚 簇 功能 不 仅 适用 于 单个 关系 ,也 适用 于 经 常 进行 连接 操作 的 多 个 关系 , 即 把 多 个 连 
接 关 系 的 元 组 按 连接 属性 值 聚集 存放 。 这 就 相当 于 把 多 个 关系 按 “ 预 连接 ”的 形式 存放 ， 
从 而 大 大 提高 连接 操作 的 效率 。 

一 个 数据 库 可 以 建立 多 个 聚 簇 ,一 个 关系 只 能 加 入 一 个 聚 簇 。 

一 般 可 以 考虑 在 如 下 情况 建立 聚 簇 。 

(1) 经 常 在 一 起 进行 连接 操作 的 关系 可 以 建立 聚 簇 。 

(2) 如 果 一 个 关系 的 一 组 属性 经 常 出 现在 相等 比较 条 件 中 , 则 该 单个 关系 可 建立 
聚焦 。 

(3) 如 果 一 个 关系 的 一 个 (或 一 组 ) 属 性 上 的 值 重复 率 很 高 , 则 此 单个 关系 可 建立 聚 
徐 , 即 对 应 每 个 聚 秘 码 值 的 平均 元 组 数 不 能 太 少 , 太 少 则 聚 徐 效 果 不 明 显 。 

必须 强调 的 是 , 聚 簇 只 能 提高 某 些 应 用 的 性 能 ,而 且 建 立 与 维护 聚 簇 的 开销 是 相当 大 的 。 
对 已 有 关系 建立 聚 包 将 导致 关系 中 元 组 移动 其 物理 存储 位 置 ,并 使 此 关系 上 原来 建立 的 所 有 
索引 无 效 ,必须 重建 。 当 一 个 聚 簇 码 值 改变 时 ,该 元 组 的 存储 位 置 也 要 做 相应 的 移动 。 

因此 ,通过 聚 簇 码 进行 访问 或 连接 是 该 关系 的 主要 应 用 ,而 与 聚 簇 码 无 关 的 其 他 访问 
很 少 或 者 是 次 要 的 ,这 时 可 以 使 用 聚 徐 。 尤 其 当 SQL 语句 中 包含 有 与 聚 簇 码 有 关 的 
ORDER BY、GROUP BY、UNION、DISTINCT 等 子 句 或 短语 时 ,使 用 聚焦 特别 有 利 ,可 
以 省 去 对 结果 集 的 排序 操作 ;否则 很 可 能 适得其反 。 


3. 哈 希 存 取 方 法 


哈 希 存 取 方法 是 用 Hash 函数 存储 和 存 取 关系 记录 的 方法 。 指 定 某 个 关系 上 的 一 个 
或 者 一 组 属性 A 作为 Hash 码 , 对 该 Hash 码 定义 一 个 函数 ( 即 Hash 函数 ) ,记录 的 存储 
地 址 由 Hash(a) 决 定 ,a 是 该 记录 在 属性 A 上 的 值 。 

有 些 数据 库 管理 系统 提供 了 Hash 存 取 方法 。 选 择 Hash 存 取 方 法 的 规则 是 : 如 果 
一 个 关系 的 属性 主要 出 现在 等 值 连接 条 件 中 或 主要 出 现在 相等 比较 条 件 中 ,而 且 满 足下 
列 两 个 条 件 之 一 , 则 此 关系 可 以 选择 Hash 存 取 方法 。 

(1) 如 果 一 个 关系 的 大 小 可 预知 ,而 且 不 变 。 

(2) 如 果 关 系 的 大 小 动态 改变 ,而 且 数 据 库 管理 系统 提供 了 动态 Hash 存 取 方法 。 


11.5.2 存储 结构 


确定 数据 库 的 物理 结构 主要 是 指 确定 数据 的 存放 位 置 和 系统 配置 ,包括 确定 关系 、 索 
引 、 聚 艇 日志、 备份 等 的 存储 安排 和 存储 结构 ,确定 系统 配置 等 。 

确定 数据 的 存放 位 置 和 存储 结构 要 综合 考虑 存 取 时 间 、 存 储 空间 利用 率 和 维护 代价 
3 方面 的 因素 。 这 3 个 方面 常常 是 相互 矛盾 的 ,因此 需要 权衡 ,选择 一 个 合适 的 方案 。 


1. 确定 存放 位 置 
数据 库 数 据 包括 关系 .索引 、 聚 徐 和 日 志 , 一 般 都 存放 在 磁盘 内 ,由 于 数据 量 的 增 大 ， 
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往往 需要 用 到 多 个 磁盘 驱动 器 和 磁盘 阵列 ,从 而 产生 数据 在 多 个 磁盘 上 进行 分 配 的 问题 ， 
这 就 需要 分 区 设计 。 分 区 设计 一 般 有 以 下 3 条 原则 。 

1) 减少 访 盘 冲突 ,提高 /O 的 并 行 性 

多 个 事务 并 发 访问 同一 磁盘 组 会 产生 访 盘 冲 突 而 引发 等 待 ,如 果 事务 访问 数据 能 均 
匀 分 布 在 不 同 磁盘 组 上 并 可 以 并 发 执行 I/O, 则 可 以 提高 数据 库 的 访问 速度 。 

2) 分 散热 点 数据 ,均衡 IO 负荷 

在 数据 库 中 ,数据 被 访问 的 频率 是 不 均匀 的 ,有 些 经 常 被 访问 的 数据 称 为 热点 数据 ， 
此 类 数据 应 该 分 散 存 放 在 各 个 磁盘 或 者 磁盘 组 上 ,以 均衡 各 个 盘 组 的 负担 。 

3) 保证 关键 数据 的 快速 访问 ,缓解 系统 颈 瓶 

在 数据 库 系 统 中 ,对 于 数据 字典 和 数据 目录 ,每 次 都 需要 访问 ,对 其 的 访问 速度 影响 
整个 系统 的 性 能 。 还 有 些 数据 对 性 能 的 要 求 特别 高 ,因此 可 以 设立 专用 磁盘 组 。 

根据 上 述 原 则 并 结合 应 用 情况 ,可 将 数据 库 数 据 的 易 变 部 分 与 稳定 部 分 、 经 常 存 取 部 
分 与 存 取 频 率 较 低 的 部 分 分 别 放 在 不 同 的 磁盘 上 。 

如 可 以 将 关系 和 索引 存放 在 不 同 磁盘 上 ,将 比较 大 的 关系 分 割 存 放 在 不 同 磁 盘 上 ,将 
日 志文 件 与 数据 库 本 身 放 在 不 同 磁盘 上 将 数据 备份 和 日 志 备份 存放 在 不 同 磁带 上 。 


2. 确定 系统 配置 


关系 数据 库 管理 系统 产品 一 般 都 提供 了 一 些 系统 配置 变量 和 存储 分 配 参 数 , 供 设计 
人 员 和 数据 库 管 理 员 对 数据 库 进 行 物理 优化 。 初 始 情况 下 ,系统 都 为 这 些 变量 赋 子 了 合 
理 的 默认 值 , 但 这 些 值 不 一 定 适 合 每 种 应 用 环境 ,在 进行 物理 设计 时 需要 重新 对 这 些 变量 
赋值 ,以 改善 系统 性 能 。 

系统 配置 变量 有 很 多 ,例如 ,同时 使 用 数据 库 的 用 户 数 、 同 时 打开 的 数据 库 对 象 
数 、 内 存 分 配 参数 ,缓冲 区 分 配 参 数 (使 用 的 缓冲 区 长 度 , 个 数 ) ,存储 分 配 参数 .物理 块 
的 大 小 、 物 理 块 装填 因子 、 时 间 片 大 小 、 数 据 库 大 小 、 锁 的 数目 等 。 这 些 参 数值 影响 存 
取 时 间 和 存储 空间 分 配 , 在 物理 设计 时 就 要 根据 应 用 环境 确定 这 些 参 数值 ,以 使 系统 
性 能 最 佳 。 


11.5.3 评价 物理 结构 
数据 库 的 物理 设计 过 程 中 需要 对 时 间 效 率 、 空 间 效 率 、 维 护 代 价 和 各 种 用 户 要 求 进行 
权衡 ,设计 出 多 个 方案 ,数据 库 设 计 人 员 必 须 对 这 些 方案 进行 详细 的 分 析 、 评 价 ,然后 从 中 


选择 一 个 较 优 的 方案 作为 数据 库 的 物理 结构 。 评 价 物理 结构 设计 完全 依赖 于 选用 的 
DBMS 。 


11.6 数据 库 的 实施 


数据 库 实 施 是 指 根据 逻辑 设计 和 物理 设计 的 结果 ,利用 DBMS 工具 建立 实际 的 数据 
库 结构 、 装 和 人 数据 实现 应 用 程序 编码 与 调试 ,并 进行 试 运行 。 
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1. 数据 库 结 构 的 建立 


利用 DBMS 提供 的 DDL 语句 建立 数据 库 及 各 种 数据 库 对 象 ,包括 分 区 、 表 、 视 图 、 索 
引 、 存 储 过 程 、 触 发 器 .用户 访问 权限 等 。 


2. 数据 载 入 


数据 载 人 是 指 在 数据 库 结构 建立 后 , 即 可 向 数据 库 中 载 人 数据 。 一 般 来 说 ,数据 库 的 
数据 量 大 ,而 且 来 源 各 异 ,经 常 出 现 数据 重复 .数据 缺失 \ 数 据 的 格式 不 同等 情况 ,因此 数 
据 组 织 .转换 和 和 人 库 的 工作 相当 费时 费力。 可 以 通过 人 工法 手动 装 和 数据 ,也 可 以 设计 
一 个 输入 子 系统 来 装 人 数据 。 不 管 哪 种 方法 ,为 了 保证 载 和 数据库 的 数据 的 正确 性 ,必须 
进行 数据 的 校 验 工 作 。 

目前 ,很 多 的 DBMS 都 提供 了 数据 导入 /导出 功能 ,有 些 DBMS 还 提供 了 强大 的 数据 
转换 服务 (DTS) 功 能 ,用 户 可 以 利用 这 些 工具 实现 数据 的 载 入 、 转 换 等 工作 。 


3. 编写 .调试 应 用 程序 


数据 库 应 用 程序 的 设计 应 和 数据 库 设计 同步 进行 。 数 据 库 应 用 程序 的 编写 与 调试 
实质 上 是 使 用 软件 工程 的 方法 进行 ,包括 开发 技术 与 开发 环境 的 选择 系统 设计 、 编 
码 .调试 等 工作 ,其 功能 应 能 全 面 满足 用 户 的 信息 处 理 要 求 ,数据 库 结构 建立 好 后 就 可 
以 开始 编制 应 用 程序 ,而 在 调试 应 用 程序 时 ,由 于 数据 入 库 工 作 尚 未 完成 ,所 以 可 先 使 
用 模拟 数据 。 


4. 数据 库 试 运行 


应 用 程序 编写 ,调试 完成 ,一 部 分 数据 入 库 后 ,就 可 以 进入 数据 库 的 试 运 行 阶段 ,测试 
各 种 应 用 程序 在 数据 库 上 的 操作 情况 。 这 一 阶段 要 完成 以 下 两 方面 的 工作 。 

(1) 功能 测试 。 实 际 运 行 应 用 程序 ,测试 能 否 完成 各 种 预订 的 功能 。 

(2) 性 能 测试 。 测 量 系 统 的 性 能 指标 ,分 析 是 否 符合 设计 目标 。 

数据 库 的 试 运行 对 于 系统 设计 的 性 能 检验 和 评价 是 很 重要 的 ,如 果 不 符合 目标 , 则 需 
要 返回 到 前 面 的 阶段 重新 进行 ,有 时 甚至 需要 返回 到 逻辑 设计 阶段 。 

数据 库 的 试 运行 不 可 能 一 次 完成 ,需要 一 定 的 时 间 ,在 此 期 间 如 果 发 生硬 件 或 软件 故 
障 ,可 能 会 破坏 数据 库 中 的 数据 ,因此 必须 做 好 数据 库 的 转 储 和 恢复 工作 。 


5. 整理 文档 














在 程序 的 编码 调试 和 试 运行 中 ,应 该 将 发 现 的 问题 和 解决 方法 记录 下 来 ,将 它们 整理 
存档 作为 资料 , 供 以 后 正式 运行 和 改进 时 参考 。 全 部 的 调试 工作 完成 之 后 ,应 该 编写 应 用 
系统 的 技术 说 明 书 和 使 用 说 明 书 ,在 正式 运行 时 随 系统 一 起 交 给 用 户 。 完 整 的 文档 资料 
是 应 用 系统 的 重要 组 成 部 分 。 
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11.7 数据 库 的 运行 和 维护 


数据 库 试 运行 合格 后 ,数据 库 开 发 工作 就 基本 完成 ,可 以 投入 正式 运行 了 。 但 是 ,由 
于 应 用 环境 在 不 断 变化 ,数据库 运行 过 程 中 物理 存储 也 会 不 断 变化 ,对 数据 库 设计 进行 评 
价 ,调整 ,修改 等 维护 工作 是 一 个 长 期 的 任务 。 

在 数据 库 运行 阶段 ,对 数据 库 经 常 性 的 维护 工作 主要 由 DBA 完成 ,其 维护 工作 主要 
包括 以 下 几 个 方面 。 


1. 数据 库 的 转 储 和 恢复 


数据 库 的 转 储 和 恢复 是 数据 库 正式 运行 之 后 最 重要 的 维护 工作 之 一 。DBA 要 针对 
不 同 的 应 用 要 求 制订 不 同 的 转 储 计划 ,定期 保存 和 备份 数据 文件 和 日 志文 件 , 以 保证 一 旦 
发 生 故 障 , 可 以 尽快 地 将 数据 恢复 到 某 种 一 致 性 状态 ,并 尽 可 能 减少 对 数据 库 的 破坏 。 


2. 数据 库 的 安全 性 完整 性 控制 


数据 库 的 安全 性 完整 性 控制 也 是 数据 库 运行 时 DBA 的 重要 工作 内 容 。 随 着 应 用 
环境 要 求 的 改变 ,数据库 对 象 的 安全 级 别 .数据库 用 户 的 权限 都 可 能 发 生变 化 ,DBA 需要 
根据 实际 情况 进行 调整 ; 除 此 之 外 ,数据 库 的 完整 性 也 可 能 发 生变 化 ,也 需要 进行 相应 的 
更 改 , 以 满足 用 户 的 需要 。 


3. 数据 库 性 能 的 监督 .分析 和 改造 


在 数据 库 运行 过 程 中 ,监督 系统 运行 ,对 监测 数据 进行 分 析 , 找 出 改进 系统 性 能 的 方 
法 是 DBA 的 又 一 重要 任务 。 目 前 ,很 多 DBMS 提供 了 检测 系统 性 能 参数 的 工具 ,DBA 
可 以 通过 这 些 工具 获取 系统 运行 过 程 中 参数 的 值 ,以 判断 当前 数据 库 系统 运行 时 存储 空 
间 的 使 用 状况 、 响 应 时 间 及 错误 ,故障 、 死 锁 发 生 的 原因 ,并 进行 相应 的 整改 。 


4. 数据 库 的 重组 织 与 重 构造 


数据 库 运 行 一 段 时 间 后 ,由 于 记录 不 断 增 、 删 、 改 ,将 会 使 数据 库 的 物理 存储 情况 变 
坏 ,出 现 很 多 空间 碎片 ,从 而 降低 数据 的 存 取 效率 ,使 得 数据 库 的 性 能 下 降 。 这 时 就 需要 
重新 整理 数据 库 的 存储 空间 , 即 数据 库 重 组 。RDBMS 一 般 都 提供 了 数据 重组 织 的 实用 
程序 。 在 重组 织 的 过 程 中 , 按 原 设计 要 求 重新 安排 存储 位 置 、 回 收 垃圾 、 减 少 指针 和 链 等 , 提 
高 数据 库 的 存 取 效率 和 存储 空间 的 利用 率 ,提高 系统 性 能 。 

数据 库 的 重组 改变 的 是 数据 库 的 物理 存储 结构 ,而 不 是 逻辑 结构 和 数据 库 中 的 数据 
内 容 。 数 据 库 的 重 构 则 不 同 , 它 是 根据 应 用 要 求 的 变化 而 改变 数据 库 的 逻辑 结构 ,部 分 修 
改 数据 库 的 模式 和 内 模式 。 例 如 ,在 数据 表 中 增加 或 者 删除 某 些 项 增加 或 者 删除 某 些 索 
引 、 增 加 或 者 删除 某 些 表 等 。 一 旦 应 用 环境 要 求 变化 太 大 ,数据 重 构 也 无 法 满足 需求 ,就 
需要 重新 设计 数据 库 应 用 系统 ,也 标志 旧 的 数据 库 应 用 系统 生命 周期 结束 ,新 的 数据 库 应 
用 系统 生命 周期 开始 。 
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11.8 数据 库 设计 案例 一 一 学 生成 绩 管 理 系统 


本 节 通 过 一 个 简单 的 案例 一 一 “学 生成 绩 管理 系统 ”来 熟悉 一 下 数据 库 及 数据 库 应 用 
系统 的 设计 和 实现 过 程 。 该 案例 包括 需求 分 析 、 概 念 结构 设计 、 逮 辑 结构 设计 ,物理 结构 
设计 ,起 到 一 个 示范 的 作用 ,并 实现 了 该 学 生成 绩 管理 系统 ,把 数据 库 设计 落实 到 数据 库 
应 用 程序 开发 中 。 


11.8.1 需求 分 析 


假设 学 校 现 在 聘请 你 作为 数据 库 设计 专家 ,请 设计 开发 学 生成 绩 管理 系统 。 
1. 功能 需求 


该 系统 主要 提供 给 学 生 ,教师 .辅导 员 以 及 管理 员 使 用 。 

(1) 学 生 模 块 应 该 实现 的 功能 : 学 生 查询 学 校 发 布 的 有 关 通 知 ,自己 的 班级 信息 、 课 
程 信息 教师 信息 、 各 门 课程 的 成 绩 信息 以 及 修改 个 人 信息 。 

(2) 辅导 员 模 块 应 该 实现 的 功能 : 辅导 员 查 询 通 知 信息 、 班 级 信息 ,课程 信息 、 教 师 
信息 、 学 生 信息 、 家 长 信息 、 学 生成 绩 、 谈 话 记录 ,修改 个 人 信息 。 

(3) 管理 员 模 块 应 该 实现 的 功能 : 教学 管理 人 员 对 通知 的 管理 ( 即 通知 的 发 布 、 删 
除 修改) 班级 管理 .课程 管理 ,教师 管理 ,学 生 管理 ,家 长 管理 ,学 期 管理 ,专业 管理 .学院 
管理 ,授课 管理 及 成 绩 统计 分 析 。 

(4) 教师 模块 应 该 实现 的 功能 : 教师 查询 、 录 入 修改 所 授课 的 学 生成 绩 信息 以 及 查 
询 课程 信息 教师 信息 、 通 知 信息 ,班级 信息 ,修改 个 人 信息 。 

学 生成 绩 管理 系统 功能 模块 图 如 图 11. 28 所 示 。 


2. 数据 需求 


要 求 此 系统 可 以 查询 以 下 信息 。 

学 生 的 基本 信息 ,包括 学 生 的 学 号 ,班级 、 姓 名 、 性 别 、 年 龄 .所 在 专业 、 电 话 号 码 、 电 子 
邮件 、 家 长 信息 、 家 长 联系 方式 .家 庭 地 址 。 学 生 通 过 此 系统 可 以 查看 其 所 选 的 所 有 课程 
的 成 绩 ,以 及 所 属 的 班级 。 

班级 的 基本 信息 ,包括 班级 编号 、 人 数 、 院 系 名 称 、 专 业 以 及 管理 该 班级 的 辅导 员 
教师 。 

课程 的 基本 信息 ,包括 课程 编号 ,课程 名 称 、 学 分 学时。 

学 院 的 基本 信息 ,包括 学 院 编号 .学院 名 称 、 学 院 办 公 室 、 学 院 联系 方式 。 

专业 的 基本 信息 ,包括 专业 编号 专业 名 称 。 

学 期 的 基本 信息 ,包括 学 期 编号 ,学 期 名 称 。 

通知 的 基本 信息 ,包括 通知 编号 ,通知 标题 ,内 容 . 时 间 、 发 布 者 ID。 

教师 的 基本 信息 ,包括 教师 编号 ,教师 名 称 ` 电 话 号 码 、. 邮 箱 、 学 院 。 其 中 部 分 教师 为 
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学 生 模块 教师 模块 
学 | | 成 | | 班 | | 教 | | 课 | | 修 班 | | 教 | | 课 | | 成 | | 成 | | 修 | | 学 
校 | | 绩 | | 级 | | 师 | | 程 | | 改 级 | | 师 | | 程 | | 绩 | | 绩 | | 改 | | 校 
通 | | 信 | | 信 | | 信 | | 信 | | 密 信 | | 信 | | 信 | | 查 | | 录 | | 密 | | 通 
知 | | 息 | | 息 | | 息 | | 息 | | 码 息 | | 息 | | 息 | | 询 | | 入 | | 码 | | 知 
查 | | 查 | | 查 | | 查 查 | | 查 | | 查 
询 | | 询 | | 询 | | 询 询 | | 询 | | 询 
辅导 员 模 块 管理 员 模块 
I | I 
学 | | 学 | | 班 | | 教 | | 课 | | 修 | | 家 学 || 通 | | 班 | | 课 | | 教 | | 学 | | 家 学 | | 学 | | 授 
生 | | 生 | | 级 | | 师 | | 程 | | 改 | | 长 校 || 知 | | 级 | | 程 | | 师 | | 生 | | 长 院 | | 期 | | 课 
信 | | 成 | | 信 | | 信 | | 信 | | 密 | | 信 通 || 管 | | 管 | | 管 | | 管 | | 管 | | 管 管 | | 管 | | 管 
息 | | 绩 | | 息 | | 息 | | 息 | | 码 | | 息 知 || 理 || 理 | | 理 | | 理 | | 理 | | 理 理 | | 开 再 
查 | | 查 | | 查 | | 查 | | 查 查 
询 | | 询 | | 询 | | 询 | | 询 询 








图 11.28 学 生成 绩 管理 系统 功能 模块 图 


专职 教师 ,一 个 专职 教师 允许 教授 多 门 课程 ,一 门 课 一 个 学 期 可 以 由 多 个 教师 教授 。 其 中 
有 部 分 教师 为 辅导 员 ,一 个 辅导 员 可 以 管理 多 个 班级 。 一 个 院 系 有 多 个 专业 ,每 个 专业 有 
多 个 班级 ,每 个 专业 都 有 专业 负责 人 ,每 个 院 系 都 有 一 个 领导 管理 。 当 学 生 一 个 学 期 课程 
不 及 格 的 课程 数量 达到 3 门 ,就 由 辅导 员 联系 学 生 进 行 辅导 工作 ,如 果 连 续 两 个 学 期 课程 
不 及 格 数量 达到 5 门 ,就 由 辅导 员 联 系 家 长 。 

管理 员 实现 对 所 有 信息 的 维护 ,学 校 的 教学 管理 人 员 充 当 管 理 员 的 角色 。 


11. 8.2 概念 结构 设计 


根据 需求 分 析 , 其 EER 图 设计 如 图 11. 29 所 示 。 

该 EER 图 说 明 如 下 。 

(1) 学 生 的 家 长 信息 涉及 内 容 较 多 ,因此 “家 长 "单独 作为 实体 ,而 不 作为 学 生 实 体 的 
属性 。 

(2) 由 于 教师 中 有 专职 教师 、 辅 导 员 、 教 学 管理 人 员 , 因 此 ,在 教师 实体 上 添加 属性 
“岗位 ”。 并 且 教 师 实体 作为 父 类 ,专职 教师 、 辅 导 员 教学 管理 人 员 作 为 子 类 。 

(3) 班级 的 辅导 员 教师 通过 班级 与 辅导 员 实体 的 联系 来 表示 ,班级 的 所 属 专业 信息 
通过 班级 与 专业 的 联系 来 表示 。 

(4) 为 了 方便 该 系统 的 扩展 ,“ 学 期 "作为 实体 ,而 不 作为 属性 。 

(5) 由 于 篇 幅 的 原因 ,在 EER 图 中 没有 画 出 “通知 "和 “学 期 "实体 的 属性 。 


11.8.3 逻辑 结构 设计 


根据 转换 规则 ,把 图 11. 29 中 的 概念 模型 转化 为 逻辑 模型 ,该 EER 图 转化 为 关系 模 
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图 11.29 学 生成 绩 管 理 系统 EER 图 
型 ,并 对 转化 后 的 关系 模型 进行 优化 ,设计 出 视图 .触发 器 ,存储 过 程 。 
1. 该 系统 的 逻辑 模型 


学 生 (学 号 ,姓名 ,性 别 ,年 龄 ,所 在 专业 ,电话 号 码 , 电 子 邮件 ,班级 编号 ,家 长 编号 ) 

家 长 (家 长 编号 ,家 长 姓名 ,家 庭 地 址 ,电话 号 码 ) 

班级 (班级 编号 ,人 数 , 院 系 名 称 , 所 在 专业 ,辅导 员 ) 

课程 (课程 编号 ,课程 名 称 ,学 分 ,学 时 ,开设 学 院 ) 

选课 (学 生 编号 ,课程 编号 ,选课 学 期 ,成 绩 ) 

教师 (教师 编号 ,教师 名 称 ,所 在 学 院 ,岗位 ,电话 号 码 ,邮箱 ,职称 ) 

授课 (教师 编号 ,课程 编号 ,授课 学 期 ,班级 编号 ) 

院 系 (学 院 编号 ,学 院 名 称 ,学 院 办 公 室 , 院 长 ,开始 日 期 ,联系 方式 ) 

专业 (专业 编号 ,专业 名 称 , 专 业 负责 人 ,开始 日 期 ,联系 方式 , 院 系 编号 ) 

学 期 (学 期 编号 ,学 期 名 称 ) 

用 户 信息 (用 户 ID, 用 户 密码 ,用 户 类 型 ) 

通知 (通知 编号 ,通知 标题 ,内 容 ,时间 ,发 布 者 ID) 

这 里 增加 一 个 用 户 信息 表 , 用 于 保存 各 用 户 的 登录 密码 及 用 户 类 型 ,所 有 用 户 的 用 户 
ID 为 自己 的 编号 ,学 生 的 用 户 ID 为 学 号 ,教师 的 用 户 ID 为 教师 编号 。 
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2. 利用 规范 化 理论 优化 关系 模型 


对 该 关系 模型 优化 到 3NF ,去 掉 非 主 属性 对 码 的 部 分 依赖 和 传递 依赖 ,修改 如 下 。 

1) 对 学 生 关系 进行 修改 

学 生 ( 学 号 ,姓名 ,性 别 ,年 龄 ,所 在 专业 ,电话 号 码 ,电子 邮件 ,班级 编号 ,家 长 编号 ) 

在 学 生 关系 中 删除 “所 在 专业 ”, 因 为 存在 传递 依赖 。 学 号 一 班级 编号 ,班级 编号 一 所 
在 专业 。 存 在 非 主 属性 “所 在 专业 ”对 码 “ 学 号 ”的 传递 依赖 , 且 “ 班 级 编号 ”与 “所 在 专业 ” 
都 存在 于 关系 班级 中 ,因此 这 里 去 掉 属性 “所 在 专业 ”, 达 到 3NF。 

2) 对 班级 关系 进行 修改 

班级 (班级 编号 ,人 数 , 院 系 名 称 ,所 在 专业 ,辅导 员 ) 

在 班级 关系 中 删除 属性 “ 院 系 名 称 ”, 因 为 存在 传递 依赖 。 班 级 编号 一 所 在 专业 ,所 在 
专业 一 院 系 名 称 。 存 在 非 主 属性 * 院 系 名 称 " 对 码 * 班 级 编号 ”的 传递 依赖 , 且 * 所 在 专业 ” 
与 “所 在 院 系 ”都 存在 于 专业 关系 中 ,因此 删除 班级 关系 中 的 属性 “ 院 系 名 称 ”。 

3) 最 后 的 结果 如 下 

学 生 ( 学 号 ,姓名 ,性 别 , 年 龄 ,电话 号 码 , 电 子 邮 件 , 班 级 编号 ,家 长 编号 ) 

家 长 (家 长 编号 ,家 长 姓名 ,家 庭 地址 ,电话 号 码 ) 

班级 (班级 编号 ,人 数 , 所 在 专业 ,辅导 员 ) 

课程 (课程 编号 ,课程 名 称 ,学 分 ,学 时 ,开设 学 院 ) 

选课 (学 号 ,课程 编号 ,选课 学 期 ,成 绩 ) 

教师 (教师 编号 ,教师 名 称 ,所 在 学 院 , 岗 位 ,电话 号 码 , 邮 箱 , 职 称 ) 

授课 (教师 编号 ,课程 编号 ,授课 学 期 ,班级 编号 ) 

院 系 (学 院 编号 ,学 院 名 称 ,学 院 办 公 室 , 院 长 ,开始 日 期 ,联系 方式 ) 

专业 (专业 编号 ,专业 名 称 ,专业 负责 人 ,开始 日 期 ,联系 方式 , 院 系 编号 ) 

学 期 (学 期 编号 ,学 期 名 称 ) 

用 户 信息 (用 户 ID, 用 户 密码 ,用 户 类 型 ) 

通知 (通知 编号 ,通知 标题 ,内 容 , 时 间 ,发 布 者 ID) 


3. 设计 用 户 子 模式 


设计 用 户 子 模式 ,分 别 为 学 生 、 教 师 、 辅 导 员 ,管理 员 设 计 用 户 子 视图 。 

1) 学 生 用 户 子 模式 

学 生 用 户 子 模式 为 学 生 用 户 进入 系统 后 所 能 查看 到 的 数据 ,包括 学 校 通 知 、 班 级 信 
息 、 课 程 信息 、 教 师 信息 ,成绩 查询 ,修改 密码 。 

学 校 通 知 模块 显示 通知 编号 、 通 知 标题 ,通知 内 容 、 发 布 者 ,发 布 时 间 。 

班级 信息 模块 根据 学 院 名 称 或 者 专业 名 称 , 或 者 班级 编号 ,查询 班级 编号 ,班级 人 数 、 
专业 名 称 、 学 院 名 称 、 辅 导 员 及 其 联系 方式 。 

课程 信息 模块 可 以 查询 到 课程 编号 .课程 名 称 .学 分 .学 时 。 

教师 信息 模块 可 以 查询 到 每 个 班级 每 门 课程 授课 教师 的 教师 名 称 、 岗 位 、 电 话 号 码 、 
授课 学 期 课程 编号 课程 名 称 、 班 级 编号 。 
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成 绩 查询 模块 可 以 查询 到 每 个 学 生 自己 每 个 学 期 的 课程 成 绩 , 包 括 学 号 .课程 编号 、 
课程 名 称 .学 期 成绩。 

因此 ,为 学 生 用 户 设计 如 下 视图 。 

(1) 班级 信息 视图 ,基于 4 个 表 ( 班 级 教师 .专业 、 院 系 ) 创 建 班级 信息 视图 ,使 得 查 
询 班 级 的 信息 更 加 方便 。 

班级 信息 视图 (班级 . 班 号 ,班级 . 人 数 ,教师 . 教师 名 称 ,教师 . 电话 号 码 , 专 业 . 专业 编 
号 ,专业 . 专业 名 称 , 院 系 .学 院 编号 , 院 系 .学 院 名 称 ) 

(2) 授课 教师 信息 视图 ,其 数据 来 自 教师 学 期 .授课 及 课程 4 个 关系 。 

授课 教师 信息 视图 (教师 编号 ,教师 名 称 ,电话 号 码 , 学 期 名 称 , 课 程 编号 ,课程 名 称 ， 
班级 编号 ) 

(3) 选课 信息 视图 ,其 信息 来 自选 课 、 课 程 及 学 期 3 个 关系 。 

选课 信息 视图 (学 号 ,课程 编号 ,课程 名 称 , 学 期 . 学 期 编号 ,学 期 . 学 期 名 称 , 成 绩 ) 

2) 教师 用 户 子 模式 

教师 用 户 子 模式 为 教师 用 户 进入 系统 后 所 能 查看 到 的 数据 ,包括 学 校 通知 、 班 级 信 
息 .课程 信息 教师 信息 、 成 绩 查询 ,修改 密码 。 其 中 ,通知 模块 、 班 级 模块 ,课程 模块 以 及 
教师 信息 模块 和 学 生 用 户 一 样 ,而 教师 信息 的 成 绩 查询 模块 需要 稍 作 修 改 。 该 模块 为 方 
便 教师 查询 所 教 课程 的 学 生成 绩 , 为 教师 用 户 设计 了 如 下 视图 。 

教师 成 绩 查 询 信息 视图 ,涉及 学 生 关 系 、 学 期 关系 、 选 课 成 绩 关 系 、 授 课表 以 及 课程 
关系 。 

教师 成 绩 查 询 信息 视图 (授课 .教师 编号 ,授课 .课程 编号 ,授课 . 授课 学 期 ,学 期 . 学 期 
名 称 , 授 课 . 班级 编号 ,课程 . 课程 名 称 , 学 生 . 学 号 ,学 生 . 姓名 ,选课 . 成 绩 ) 。 

3) 辅导 员 用 户 子 模式 

辅导 员 用 户 子 模式 涉及 学 校 通知 模块 .班级 信息 模块 .课程 信息 模块 .教师 信息 模 
块 . 个 人 信息 修改 模块 .家 长 信息 模块 ,学生 信息 模块 ` 成 绩 查询 模块 及 谈话 记录 模块 。 
前 面 的 模块 功能 相同 ,只 有 家 长 信息 和 学 生 信息 模块 是 新 添加 的 模块 ,而 成 绩 查询 模 
块 查询 某 个 班 某 个 学 期 的 成 绩 ,或 者 具体 某 个 学 生 的 成 绩 。 为 辅导 员 用 户 设计 如 下 
视图 。 

(1) 家 长 信息 视图 ,涉及 学 生 关系 、 家 长 关系 及 班级 关系 。 

家 长 信息 视图 (学 号 ,学 生 姓名 ,学 生 班 号 ,家 长 编号 ,家 长 姓名 ,家 庭 地址 ,家 长 电话 
号 码 ,班级 . 辅导 员 编号 ) 

(2) 学 生 信息 视图 ,涉及 学 生 关 系 、 班 级 关系 。 

学 生 信 息 视图 (学 号 ,姓名 ,年 龄 ,电话 号 码 ,电子 邮件 ,学 生 . 班 号 ,辅导 员 编 号 ) 

(3) 辅导 员 查 询 成 绩 视图 ,涉及 学 生 、 班 级 .选课 .课程 .学 期 5 个 关系 。 

辅导 员 查 询 成 绩 视图 (学 生 . 学 号 ,学 生 . 姓名 ,班级 . 班 号 ,选课 . 选课 学 期 ,学 期 . 学 期 
名 称 ,选课 . 课程 编号 ,课程 . 课程 名 称 ,选课 . 成 绩 , 辅 导 员 编号 ) 

(4) 触发 器 。 

当 学 生 一 个 学 期 课程 不 及 格 的 课程 数量 达到 3 门 时 ,就 由 辅导 员 联 系 学 生 进 行 辅导 
工作 ,如 果 连 续 两 个 学 期 课程 不 及 格 数量 达到 5 门 ,就 由 辅导 员 联 系 家 长 。 因 此 ,建立 家 
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长 联系 关系 包括 属性 (学 生 编号 ,学 期 ,不 及 格 课程 数量 ) ,并 在 学 生 的 选课 表 上 建立 触发 
器 , 当 某 学 生 某 个 学 期 不 及 格 的 课程 数量 达到 3 门 及 以 上 , 则 触发 触发 器 实现 对 家 长 联系 
表 插 入 该 学 生 的 相关 信息 ,表示 辅导 员 应 该 与 此 学 生 谈 话 ,在 后 面 的 数据 库 代 码 部 分 由 触 
发 器 (tri_notpass) 实 现 。 

4) 管理 员 用 户 子 模式 

管理 员 用 户 子 模式 涉及 学 校 通知 模块 .班级 管理 模块 .课程 管理 模块 .教师 信息 管理 
模块 .学生 信息 管理 模块 家 长 信息 管理 模块 .成 绩 查 询 模块 ,专业 管理 ,学院 管理 .学 期 管 
理 模块 统计 分 析 模块 .授课 管理 模块 ,都 是 直接 对 关系 表 的 操作 。 其 中 的 统计 分 析 模 块 
的 实现 需要 建立 如 下 存储 过 程 。 

(1) 按 班级 分 课程 成 绩 分 析 模 块 ,从 教师 成 绩 查询 子 视图 里 获取 每 个 班级 每 门 课程 
学 生 的 成 绩 数据 。 

获取 每 个 班级 每 门 课程 学 生 的 优 、 良 、 中 、 及 格 、 不 及 格 的 成 绩 分 布 数据 。 此 处 用 存储 
过 程 实现 。 创 建 存储 过 程 ,根据 输入 的 班级 编号 及 课程 编号 输出 每 个 成 绩 分 布 阶段 的 人 
数 。 由 后 面 的 数据 库 代 码 中 的 存储 过 程 (class_course_grade) 实 现 ,并 用 图 表 的 形式 显示 
成 绩 分 布 情况 。 

(2) 分 班级 获取 每 个 学 生 所 有 科目 的 成 绩 及 总 成 绩 ,涉及 的 数据 库 代码 为 (class_ 
grade_analysis) 。 

(3) 查询 每 个 学 生 的 所 有 成 绩 ,根据 管理 员 输 入 的 学 号 获取 该 学 生 所 有 学 期 所 有 课 
程 的 成 绩 。 


11.8.4 物理 结构 设计 


因为 学 生成 绩 管理 系统 的 存储 空间 需求 较 小 ,我 们 主要 考虑 的 是 事务 响应 速度 ,所 以 
考虑 建立 索引 ,根据 建立 索引 的 规则 ,主要 在 以 下 几 个 方面 建立 索引 。 

(1) 查询 条 件 涉 及 的 属性 。 

(2) 连接 条 件 涉 及 的 属性 。 

由 于 此 系统 的 访问 量 比较 小 ,因此 在 本 系统 中 没有 建立 索引 。 


11.8.5 相关 数据 库 代码 


1. 部 分 建 表 代码 


CREATE table 家 长 ( 

家 长 编号 INT identity (1,1) PRIMARY KEY, 
家 长 姓名 CHAR(30)， 

家 庭 地 址 CHAR (100)， 

电话 号 码 CHAR (20) 

); 

CREATE table 专业 ( 
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专业 编号 CHAR (10)not null, 
院 系 编号 CHAR(10)null, 
专业 名 称 CHAR (20)null, 
专业 负责 人 CHAR(10)null， 
开始 日 期 DATETIME, 

联系 方式 CHAR(20)null, 

); 

CREATE table 学 院 ( 

学 院 编 号 CHAR(10)not null, 
学 院 名 称 CHAR (20)null, 
院 长 编号 CHAR(10)null, 
学 院 办 公 室 CHAR (60)null, 
联系 方式 CHAR (20)null, 
开始 日 期 DATETIME, 

); 

CREATE table 学 生 ( 

学 号 CHAR(20)not null, 
姓名 CHAR(20)null, 

年 龄 INT null, 

性 别 cHAR(2)， 

电话 号 码 CHAR(11)null, 
电子 邮件 CHAR(20)null, 
班 号 CHAR(10)null, 

家 长 INT null, 

) 

CREATE table 学 期 ( 

学 期 编号 INT identity(1,1)not null, 
学 期 名 称 CHAR (20)null 

); 

CREATE table 选课 ( 

学 号 CHAR(20)nu1l1, 

课程 编号 CHAR(10)null, 
选课 学 期 INT null, 

成 绩 REAL nu]l1 

) 7 

CREATE table 授课 ( 

教师 编号 CHAR (10)not null, 
课程 编号 CHAR(10)not null, 
授课 学 期 CHAR (20)null, 
班级 编号 CHAR(10)not null, 
PRIMARY KEY 

( 

教师 编号 ， 
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课程 编号 ， 

授课 学 期 

)) 7 

CREATE table 课程 ( 

课程 编号 CHAR(10)not null, 
课程 名 称 CHAR (20)null, 
学 分 REAL null, 

学 时 INT noll, 

开设 学 院 CHAR(10) 

); 


2. 建立 视图 代码 


1) 学 生 用 户 子 模式 
(1) 创建 班级 信息 视图 ,代码 为 


CREATE VIEW 班级 信息 

RS 

SELECT 班级 . 班 号 ,班级 .人 数 ,教师 .教师 名 称 ,教师 .电话 号 码 ,专业 .专业 编号 ,专业 .专业 名 称 , 院 
系 .学 院 编号 , 院 系 .学 院 名 称 

FROM 班级 ,教师 ,专业 , 院 系 

WHERE 教师 .教师 编号 = 班级 .辅导 员 编 号 AND 班级 .专业 编号 = 专业 .专业 编号 and 专业 . 院 系 编号 
= 院 系 .学 院 编号 ; 


(2) 创建 “授课 教师 信息 ”视图 ,代码 为 


CREATE VIEW 授课 教师 信息 

RS 

SELECT 教师 .教师 编号 ,教师 名 称 , 电 话 号 码 ,学 期 名 称 ,课程 .课程 编号 ,课程 名 称 ,班级 编号 
FROM 教师 ,授课 ,课程 ,学 期 

WHERE 教师 .教师 编号 = 授课 .教师 编号 AND 课程 .课程 编号 = 授课 .课程 编号 AND 学 期 .学 期 编号 = 
授课 .授课 学 期 ; 


改 为 左 外 连接 ,因为 学 校 除 了 上 课 的 教师 ,还 有 没有 授课 的 教师 及 辅导 员 等 其 他 职工 。 


CREATE VIEW 授课 教师 信息 

RS 

SELECT 教师 .教师 编号 ,教师 名 称 ,岗位 ,电话 号 码 ,学 期 名 称 ,课程 .课程 编号 ,课程 名 称 ,班级 编号 
FROM 教师 ”LEFT OUTER JOIN 授课 ON 教师 .教师 编号 = 授课 .教师 编号 LEFT OUTER JOIN 课程 
ON 课程 .课程 编号 = 授课 .课程 编号 join 学 期 on 学 期 .学 期 编号 = 授课 .授课 学 期 ; 


(3) 创建 选课 信息 视图 ,代码 为 : 


CREATE VIEW 选课 信息 
Ans 
SELECT 学 号 ,课程 .课程 编号 ,课程 名 称 ,学 期 .学 期 名 称 , 学 期 .学 期 编号 ,成 绩 
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FROM 选课 ,课程 ,学 期 
WHERE 选课 .选课 学 期 = 学 期 .学 期 编号 AND 选课 .课程 编号 = 课程 .课程 编号 ; 


2) 教师 用 户 子 视图 
创建 教师 成 绩 查 询 信息 视 图 ,代码 为 : 


CREATE VIEW 教师 成 绩 查 询 信息 

RS 

SELECT 授课 .教师 编号 ,授课 .课程 编号 ,授课 .授课 学 期 ,学 期 .学 期 名 称 , 授 课 . 班 级 编号 ,课程 . 课 
程 名 称 , 学 生 .学 号 ,学 生 .姓名 ,选课 .成 绩 

FROM 授课 ,选课 ,课程 ,学 生 ,学 期 

WHERE 授课 .课程 编号 = 课程 .课程 编号 AND 授课 .课程 编号 = 选课 .课程 编号 AND 授课 .班级 编号 = 
学 生 . 班 号 AND 选课 .学 号 = 学 生 .学 号 AND 授课 .授课 学 期 = 学 期 .学 期 编号 ; 


3) 辅导 员 用 户 子 视图 
(1) 创建 家 长 信息 视图 ,代码 为 : 


CREATE VIEW 家 长 信息 

RS 

SELECT 学 生 .学 号 ,学 生 .姓名 ,学 生 . 班 号 ,家 长 .家 长 编号 ,家 长 .家 长 姓名 ,家 庭 地 址 ,家 长 .电话 号 
码 ,班级 .辅导 员 编 号 

FROM 学生, 家 长 ,班级 

WHERE 班级 . 班 号 = 学 生 . 班 号 RND 学 生 .家 长 = 家 长 .家 长 编号 ; 


(2) 创建 学 生 信息 视图 ,代码 为 : 


CREATE VIEW 学 生 信息 

RS 

SELECT 学 号 ,姓名 ,年 龄 ,电话 号 码 ,电子 邮件 ,学 生 . 班 号 ,辅导 员 编号 
FROM 学生, 班级 

WHERE 学 生 . 班 号 = 班级 . 班 号 ; 


(3) 创建 辅导 员 查 询 成 绩 视图 ,代码 为 


CREATE VIEW 辅导 员 成 绩 查询 信息 

RS 

SELECT 学 生 .学 号 ,学 生 .姓名 ,班级 . 班 号 ,选课 .选课 学 期 ,学 期 .学 期 名 称 ,选课 .课程 编号 ,课程 . 
课程 名 称 ,选课 .成 绩 ,辅导 员 编 号 

FROM 学生, 班级 ,选课 ,课程 ,学 期 

WHERE 学 生 . 班 号 = 班级 . 班 号 AND 学 生 .学 号 = 选课 .学 号 AND 选课 .课程 编号 = 课程 .课程 编号 

AND 学 期 .学 期 编号 = 选课 .选课 学 期 ; 


3. 触发 器 


本 系统 中 的 触发 器 代码 如 下 。 
CREATE TABIE 家 长 联系 表 


数据 库 设计 


( 

学 生 编 号 CHAR (20)， 
学 期 编号 INT, 

不 及 格 课程 数量 INT 
) 


CREATE TRIGGER tri notpass 

ON 选课 

AFTER INSERT 

RS 

DECLARE @ stuno char (20) ,Q semsterno int, @notpassno int,@ count int; 
SELECT @ stuno= 学 号 ,@ semsterno= 学 期 编号 FROM inserted; 

SELECT @ notpassno= count (课程 编号 ) 

FROM 选课 

WHERE 成 绩 < 60 RND 学 号 =@ stuno AND 学 期 编号 =@ semsterno 

GROUP BY 学 号 ,学 期 编号 having count (课程 编号 )>=2; 

SELECT @ count= count (x )FROM 家 长 联系 表 WHERE 学 生 编 号 =@ stuno; 
IF((@ notpassno>=2)AND(@ count<1)) 

INSERT INTO 家 长 联系 表 VALUES (@ stuno,@ semsterno, @notpassno); 
ELSE 

UPDATE 家 长 联系 表 

SET 不 及 格 课程 数量 =8 notpassno 

WHERE 学 生 编 号 =@ stuno; 

PRINT ' 添 加 学 生成 功 '; 


4. 存储 过 程 代 码 


在 管理 员 成 绩 统计 分 析 模 块 中 设计 了 以 下 存储 过 程 。 

(1) 按 班级 分 课程 成 绩 分 析 模 块 ,从 教师 成 绩 查询 子 视图 里 获取 每 个 班级 每 门 课程 
学 生 的 成 绩 数据 。 

获取 每 个 班级 每 门 课程 学 生 的 优 、 良 、 中 、 及 格 \ 不 及 格 的 成 绩 分 布 数据 。 此 处 用 存储 
过 程 实现 。 创 建 存储 过 程 ,根据 输入 的 班级 编号 及 课程 编号 输出 每 个 成 绩 分 布 阶 段 的 人 
数 ,代码 如 下 所 示 : 


CREATE PROCEDURE class_course _ grade 
@class char (10), 

@ course char (10), 

@ notpass int output, 

@pass int output, 

@avg int output, 

@ good int output, 

Qexcellent int output 


RS 
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SELECT @ notpass= count (成 绩 ) 

FROM 教师 成 绩 查 询 信息 

WHERE 课程 编号 =@ course AND 班级 编号 =@ class AND 成 绩 < 60 

SELECT @ pass= count (成 绩 ) 

FROM 教师 成 绩 查 询 信息 

WHERE 课程 编号 =@ course AND 班级 编号 =@ class AND 成 绩 >= 60 AND 成 绩 <70 
SELECT @ avg= count (成 绩 ) 

FROM 教师 成 绩 查 询 信 息 

WHERE 课程 编号 =@ course AND 班级 编号 =@ class AND 成 绩 >=70 AND 成 绩 < 80 
SELECT @ good= count (成 绩 ) 

FROM 教师 成 绩 查 询 信 息 

WHERE 课程 编号 =@ course AND 班级 编号 =eclass AND 成 绩 >=80 AND 成 绩 < 90 
SELECT @ excellent= count (成 绩 ) 

FROM 教师 成 绩 查 询 信 息 

WHERE 课程 编号 =8 course AND 班级 编号 =8 class AND 成 绩 >= 90 and 成 绩 <=100 


此 存储 过 程 根据 输入 的 班级 编号 参数 值 和 课程 编号 参数 值 ,输出 该 班级 该 课程 学 生 


不 及 格 人 数 、 及 格 人 数 等 各 个 阶段 的 人 数 。 测 试 代码 如 下 。 
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DECLARE @ bujige int,@ jige int,@ zhong int,@ liang int,@ you int 

EXEC class_course grade @ class= '1106101',@ course= '1',@ notpass=@ bujige 
OUTPUT, @ pass=@ jige output, @ avg=@ zhong output,@ good=@ liang 

OUTPUT, @ excellent=@ you output 

SELECT @ bujige,@ jige,®@ zhong,@ liang,@ you 


另 一 种 写法 如 下 。 


CREATE PROCEDURE class_course grade3 

@class char (10), 

@ course char (10), 

@ notpass int output, 

@pass int output, 

@avg int output, 

@ good int output, 

Qexcellent int output 

RS 

BEGIN 

SELECT @ notpass= count (CASE WHEN 成 绩 < 60 THEN 1 END) ， 

@ pass= count (CASE WHEN 成 绩 < 70 AND 成 绩 >= 60 THEN 1 END)， 
@Q@ avg= count (CASE WHEN 成 绩 < 80 AND 成 绩 >=70 THEN 1 END)， 
@ good= count (CASE WHEN 成 绩 < 90 AND 成 绩 >= 80 THEN 1 END)， 
@Q@ excellent= count (CASE WHEN 成 绩 <100 AND 成 绩 >= 90 THEN 1 END) 
FROM 教师 成 绩 查 询 信息 

WHERE 课程 编号 =8 course AND 班级 编号 =eclass 


数据 库 设计 


END 
第 三 种 写法 如 下 。 


CREATE PROCEDURE class course grade2 

RS 

BEGIN 

CREATE TABLE ##t (不 及 格 INT, 及 格 INT, 中 INT, 良 INT, 优 INT) 
INSERT INTO ##t SELECT count (CASE WHEN 成 绩 < 60 THEN 1 END) 不 及 格 ， 
COUNT (CASE WHEN 成 绩 < 70 RND 成 绩 >= 60 THEN 1 END) 及 格 ， 
COUNT (CASE WHEN 成 绩 < 80 RND 成 绩 >=70 THEN 1 END) 中 ， 

COUNT (CASE WHEN 成 绩 < 90 AND 成 绩 >= 80 THEN 1 END) 良 ， 

COUNT (CASE WHEN 成 绩 <100 AND 成 绩 >= 90 THEN 1 END) 优 

FROM 教师 成 绩 查 询 信息 

WHERE 课程 编号 = '1' AND 班级 编号 = '1106101' 

SELECT * FROM ##t 

END 


(2) 分 班级 获取 每 个 学 生 所 有 科目 的 总 成 绩 。 


DECLARE @ class char(10) 

SET @ class= '1106101" 

SELECT left (学 号 ,7), 学 号 ,sum( 成 绩 ) 总 成 绩 
FROM 选课 

WHERE left (学 号 ,7)=@class 

GROUP BY 学 号 

ORDER BY left (学 号 ,7) ,学 号 


(3) 分 班级 获取 每 个 学 生 所 有 科目 的 成 绩 及 总 成 绩 。 涉 及 的 数据 库 代 码 写 成 存储 过 
程 的 形式 ,代码 如 下 。 


CREATE PROCEDURE class grade analysis 

@class char(10) 

RS 

BEGIN 

DECLARE @ sql varchar (max) 

SET 8 sql= 'SELECT 学 号 ' 

SELECT @ sql=@ sql+ ',，max (CASE WHEN 课程 名 称 ='''+ 课 程 名 称 +''' THEN 成 绩 ELSE '''' 
END) ['"+ 课 程 名 称 + ']' FROM (SELECT DISTINCT 课程 名 称 FROM 选课 信息 )t 

SET @ sql= STUFF (@ sql,12,1,"'") 

SET @ sql=@ sql+ ', sum( 成 绩 ) 总 分 FROM 选课 信息 ”WHERE left (学 号 ,7)="'''+@ class+t '"' 
GROUP BY 学 号 ORDER BY 总 分 ' 

EXEC (@ sql) 

END 


测试 语句 为 : EXEC class_grade_analysis @class 一 '1106101'。 
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11.8.6 部 分 模块 界面 图 


1. 学 生 功 能 模块 


在 学 生 功 能 模块 窗口 中 ,学 生 用 户 输入 账号 及 密码 登录 后 进入 学 生 用 户主 界面 ,如 
11. 30 所 示 。 








图 11.30 学 生 用 户主 界面 


(1) 学 校 公告 功能 : 列 出 与 该 学 生 有 关 的 通知 信息 ,如 图 11. 31 所 示 。 















































€ > ©O | localhost49815/studentFramesethtml 四 女 | 三 四 和 … 
阶 引 和 者 时 间 内 容 

尝 术 通知 。 | 者 椒 开 允 了 所 有 人 |2014/4/20 星 期 日 7.08:27| 

班级 信息 。 ”上 2 | 成 绩 如 有 疑问 ， 可 以 去 教务 处 核对 | 所 有 人 |2014/4/20 星期 日 17:09:41| 

人 3 霸业 设计 |2017/5/22 星期 一 22:09:35| 

课程 信息 。 | 境 业 答 因 |2017/5/22 星期 一 22:09:49| 

教师 信息 话语 四 级 报名 了 | 所 有 人 |2017/5/23 星期 二 18:03:33| 
10 _ | 补考 通知 | 所 有 人 |2017/5/23 星期 二 18:05:42 请 需 补考 的 同学 抓紧 时 间 报名 

成 顷 查 询 |11 开 餐 通知 | 所 有 人 |2017/5/23 星期 二 20:24:07| 从 下 星期 一 新 食堂 开始 营业 

修改 密码 

退出 系统 











11.31 学 校 公告 


(2) 班级 信息 查询 功能 : 根据 班级 编号 查询 班级 的 相关 信息 ;只 选择 某 个 学 院 时 , 查 
询 出 某 个 学 院 的 所 有 班级 相关 信息 ; 当 只 选择 某 个 专业 时 , 则 查询 出 该 专业 所 有 的 班级 信 
息 ; 当 不 选择 任何 学 院 . 专 业 \ 班 级 编号 时 ,查询 出 所 有 班级 的 相关 信息 ,包括 班级 人 数 、 班 
主任 姓名 ,电话 号 码 ,班级 的 专业 名 称 及 学 院 名称 ; 否 则 ,根据 所 选择 的 学 院 及 专业 查询 班 
级 的 相关 信息 。 图 11. 32 列 出 了 信息 学 院 的 计算 机 科学 与 技术 专业 所 有 班级 的 相关 信 














息 。 图 11. 33 显示 的 是 全 校 的 所 有 班级 的 相关 信息 。 





€ 2 ©O | iocaihost49815/studentframesethtml 钙 女 | 


班级 查询 














通知 。 所 在 学 院 ，[ 信 入 学 院 ”| 所 在 专业 计划 机 学 与 扩 村] 斑 级 缩 号 | 














班 号 | 人 数 避 师 名 称 | 电话 号 码 | 。 专业 名 称 


学 院 名 称 





课程 信息 1006101|34 ”| 李 风 飞 |13007378975| 计 算 机 科学 与 技术 | 


| 信息 学 院 





1006102|33 ”| 地 风 飞 |13007378975| 计 算 机 科学 与 技术 | 


信息 学 院 









































师 信息 1013101|38 “| 地 凤 飞 |13007378975| 计 算 机 科学 与 技术 | 信息 学 院 
| 成绩 查 询 1106101|34 “| 地 风 飞 |13007378975| 计 算 机 科学 与 技术 | 信息 学 院 

1106102|35 ”| 浮 风 飞 |13007378975| 计 算 机 科学 与 技术 | 信息 学 院 
修改 密码 1206101B2 网 青 青 “|13105667894| 计 算 机 科学 与 技术 | 信息 学 院 














图 11.32 ”学生 用 户 班级 查询 界面 





















































尝 术 通知 。。 所 在 学 院 ， 习 所 在 专业 | 本 班级 编号 忆 
损 信 现 人 刺 训 称 一 电话 寻 码 | 专业 名 称 
课程 信息 1006101|34_ 麻 同 改 _|13007378975| 计 算 机 科学 与 技术 





1006102|33 麻风 飞 “|13007378975 计 算 机 科学 与 技术 








1013101|38 ”| 滁 风 飞 |13007378975| 计 算 和 科学 与 技术 








成 绩 查 光 1106101|34 “| 漂 风 飞 |13007378975| 计 算 机 科学 与 技术 





1106102|35 “| 李 风 飞 |13007378975| 计 算 机 科学 与 技术 





修改 密码 1112101|34 | 地 风 飞 |13007378973 对 外 汉语 











1206101|32 | 刘 青 青 ”|13105667894| 计 算 机 科学 与 技术 















































站 出 于 流 1306101|30_ 则 青青 “|13105667894| 网 络 工程 
1406101|23 ” 则 青青 “|13105667834| 网 络 工程 让 
1406102|28 ”| 则 青青 |13105667894| 信 息 管理 与 信息 系统 | 信息 学 院 
1506101|30 刘 青 青 。 |13105667894| 通 信 工 程 物理 学 院 
图 11. 33 全 校 班级 查询 结果 界面 
其 主要 代码 如 下 : 


if (xueyuan =="" && zhuanye =="" && banji =="") 
和 


SqlConnection cn=new 


SqlConnection ("server= localhost;database= chengji;user= sa;password= 


123456"); 





SqlCommand cmd= new SqlCommand ("SELECT 班 号 ,人 数 , 教 师 名 称 ,电话 号 码 , 专 业 名 称 ,学 院 名 


称 FROM 班级 信息 "，cn)7 

SqlDataadapter da=new SqlDataAdapter (cmd) 7 
DataSet ds=new DataSet (); 

da.Fill (ds, "questions"); 

GridView]l .DataSource=ds.Tables[0] .DefaultView; 
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GriqView] .Visible=true; 
GridView1.DataBind()7 


(3) 课程 信息 查询 : 根据 下 拉 菜 单 中 课程 编号 或 者 课程 名 称 显示 该 课程 的 相关 信 


息 ,包括 课程 编号 ,课程 名 称 、 学 分 、 学 时 ; 当 既 不 选择 课程 编号 或 者 也 不 选择 课程 名 称 时 ， 
则 显示 全 校 所 有 的 课程 信息 ,如 图 11. 34 所 示 。 




































































€ > O | localhost49915/studentFramesethtml iD 太 | 三 个 
课程 信息 查询 
各 课程 编号, [末了 。 或。 课程 名 各 J [ 国 
a 了 和 课程 名 称 序 东 学 村 
阳 程 信息 1 | 计算 机 基础 ”2 |48 
> 10 人 获 据 挖掘 5 |48 
师 信息 2 | 学 英语 3 |48 
$b 博 查 站 3 | 高等 数学 上 48 
区 4 | 高 等 数学 下 | |48 
竹 改 密码 5 路 据 结构 ll48 
l 6 哮 据 库 pls 
也 王 入 7 肢 据 结构 3 |48 
8 计算 机 网 络 48 
9 计算 机 通信 技术 3 |56 
































图 11.34 学 生 用 户 课程 信息 查询 界面 


(4) 授课 教师 信息 查询 : 根据 所 选课 程 名 称 和 班级 编号 ,查询 出 教授 该 班级 该 门 课 
程 的 相关 教师 信息 ; 当 不 选择 任何 课程 名 称 及 班级 编号 时 , 则 查询 出 所 有 授课 情况 信息 ， 
包括 某 个 学 期 某 个 班级 的 某 门 课程 是 由 哪个 教师 教授 ,并 显示 该 授课 教师 的 电话 号 码 及 
相应 的 岗位 ,如 图 11. 35 所 示 。 

































































€ 2 O | localhost49815/studentFramesethtml 了 让 | 三 加 外 … 
教师 信息 查询 
课程 名 各 了 现下 J 
班级 信息 = i 3 
用 师 名 称 岗位 | 电话 号 码 | 授课 学 期 | 课程 编号 | 课程 名 称 ”下级 编号 
课程 信息 张 轻 ”后 师 |13807311204|2014 年 上 学 期 |8 计算 机 网 络 。 |1006101 
要 田 风 | 教师 |13807311245|2014 年 下 学 期 6 网 据 库 1006101 
教师 信息 奇 李 困 “ 救 师 _|13807315639 2011 年 上 学 期 | 计算 机 基础 。 |1106101 
成 绩 查 询 压 厚 德 “ 救 师 _|13507372589|2015 年 上 学 期 9 计算 机 通信 技术 |1206101 
直 多 多 扩 师 2016 年 下 学 期 |10 殿 据 控 握 1306101 
修改 密码 锐 “ 懂 师 
退出 系统 麻风 飞 辅导 员 |13007378975| 
: 情 青 “辅导 出 13105667894| 
































11.35 教师 信息 查询 结果 界面 


图 11. 36 列 出 了 何 李 田 老师 在 2011 年 上 学 期 教授 1106101 班 的 计算 机 基础 课程 。 
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教师 信息 查询 





























尝 术 通知 课程 名 称 | 计 莫 WE 动 。 “| 班级 编号 [7106101 | 。 [天 汪 
SR 称 丙 可 | 和 话 避 而 | 披 尝 学 月 i 程 太 村 | 课程 名 称 于 到 太 本 





























岗 授课 
上 I 在 由 ”lvl en ero ise OH | 儿科 直 zhly ncn 


数据 库 设计 


(5) 成 绩 查询 : 根据 学 生 选 择 的 学 期 及 课程 名 称 , 查 询 出 该 学 生 该 门 课 程 的 成 绩 ; 或 
者 根据 所 选择 的 学 期 , 列 出 当前 学 期 的 所 有 课程 的 成 绩 ,如 图 11. 37 所 示 ; 或 者 根据 所 选 
择 的 课程 名 称 , 列 出 该 学 生 该 课程 的 成 绩 ; 当 不 做 任何 选择 时 , 则 查询 出 此 学 生 的 所 有 学 
期 所 选 的 所 有 课程 的 成 绩 , 列 出 学 生 学 号 .所 选课 程 编号 ` 课 程 名 称 .学 期 信息 以 及 成 绩 。 
11. 37 显示 了 学 号 为 110610101 号 的 学 生 2012 年 上 学 期 所 选 的 所 有 课程 的 成 绩 及 相 
关 信息 。 图 11. 38 显示 了 学 号 为 110610101 号 的 学 生 所 有 学 期 所 有 课程 及 其 成 绩 。 







































































€ > 日 | locaihost49815/studentFramesethtml 让 | 三 四 
成 绩 查 询 
i 学 年 学 期 ，[2012 年 上 学 两 ~] 课程 名 种 J 国王 
班级 信息 
浊 程 信息 
i 这 号 全 各 记号 | 课程 名 称 | 学 戎 名 字 | 成 而 
| 成绩 查询 110610101|3 计算 机 基础 |2012 年 上 学 期 |54 
E 110610101|6 计算 机 基础 |2012 年 上 学 期 |50 
| 退出 系 境 





11. 37 某 学 期 所 有 成 绩 查 询 结 果 界 面 



























































€ > © | localhost49815/studentFramesethtml 让 | 三 四 马 … 
成 绩 查 询 

家 学 年 学 期 ， 课程 称 J 国 天 

班级 信息 

课程 信息 

人 孚 可 全 各 大 可 课程 名 称 | 学 贡 名 字 成 册 

成绩 查询 110610101|1 计算 机 基础 2011 年 上 学 期 |82 
110610101|1 计算 机 基础 2011 年 上 学 期 |82 

修改 密码 110610101 高 等 玖 学 上 |2012 年 上 学 期 |34 

退出 系统 110610101|6 踊 据 库 ”|2012 年 上 学 期 (50 
110610101|8 计算 机 网 络 |2014 年 上 学 期 |89 
110610101]7 肚 据 结构 “|2014 年 上 学 期 49 
1106101012 [大 学 英语 “|2014 年 上 学 期 45 
































图 11. 38 所 有 课程 成 绩 查询 结果 界面 
(6) 修改 密码 : 学 生 可 以 修改 自己 的 登录 密码 ,如 图 11. 39 所 示 。 
2. 教师 功能 模块 


在 教师 功能 模块 窗口 中 ,教师 用 户 输入 账号 及 密码 登录 后 进入 教师 用 户主 界面 ,如 
图 11. 40 所 示 。 

其 中 ,学 校 通知 班级 信息 ,课程 信息 教师 信息 查询 界面 与 学 生 界面 类 似 。 不 同 的 界 
面 主 要 是 成 绩 查 询 以 及 录入 成 绩 界面 。 
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€ 人 日 | iocost4o8ii/studentFrameethm 四 文 | 三 加 外 … 
修改 密码 

学 校 通知 请 输入 新 密码 : 

班级 信 确认 密码 | 

设 程 信和 i 

教师 信息 

成 绩 查 询 

修改 密码 

退出 系统 











图 11.39 修改 密码 界面 


€ 人 日 | iocalnost498ls/teaderrrmn | 三 四 - 








图 11.40 教师 用 户主 界面 
(1) 成 绩 查询 : 查询 出 该 登录 教师 在 某 个 学 期 某 个 班级 某 门 课程 的 所 有 学 生 的 成 
绩 ; 当 不 做 任何 选择 时 ,查询 出 该 登录 教师 用 户 的 所 有 学 期 所 授 所 有 班级 的 所 有 课程 的 所 
有 学 生成 绩 ,如 图 11. 41 所 示 ,该 教师 只 教 了 一 个 班级 。 
图 11.42 显示 了 2014 年 下 学 期 的 1006101 班 的 数据 库 课程 学 生成 绩 查询 结果 。 






























































学 年 学 期 ，[201 和 学 同 ~] 课程 名 种 骂 大计 “| 班级 编号 [1005107 ~] [| 
人 二 
课程 信息 [2014 年 下 学 期 6 收据 库 |1006101 |100610103|78 
I2014 年 下 学 期 6 吐 据 库 1006101 |100610101|82 
师 信息 D014 年 下 学 期 6 敬 据 库 |1006101 |100610102|56 
成 绩 坦 询 
录入 成绩 
修改 密码 
退出 系统 
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11.42 ”成绩 查询 结果 





数据 库 设计 







































































€ SS ©O | iocaihost49815hteacherfamesethtml nAk| 三 区 OQ.… 
成 绩 查 询 
尝 村 通知 学 年 学 期 可 课 和 名 | 更 级 编 S EE 
课程 信息 |2014 年 下 学 期 |6 踊 据 库 |1006101 |100610103|78 
[2014 年 下 学 期 |6 网 据 库 “|1006101 |100610101|82 
趣 师 信息 2014 年 下 学 期 |6 茹 据 库 “|1006101 |100610103|56 
成 绩 查 询 
录入 成 清 
修改 密码 
退出 系 流 











11.41 教师 成 绩 查询 界面 


(2) 录入 成 绩 ,教师 可 以 选择 要 录入 成 绩 的 学 期 .课程 并 输入 相应 学 生 的 学 号 以 及 成 
绩 ,如 图 11. 43 所 示 。 


















































€ DS OO localhost40i5/eacerFran 妇 | 三 四 
Meee 
录入 成 绩 
和 学 期 编号 ，[2011 年 上 学期 ~ 
到 信息 
课程 号 ，[ 计 算 儿 基础。 | 
让 Hi ~ 
学 号 
者 电信 息 
网 
也 NE LE 
修改 密码 
退出 系统 
图 11.43 成 绩 录入 界面 
3. 辅导 员 功 能 模块 


在 辅导 员 功 能 模块 窗口 中 ,辅导 员 用 户 输入 账号 及 密码 登录 后 进入 辅导 员 主 界面 ,如 
11.44 所 示 。 

其 中 ,学 校 通 知 、 班 级 信息 .课程 信息 .教师 信息 查询 界面 与 学 生 用 户 及 教师 用 户 界面 
类 似 。 

(1) 学 生 信息 查询 : 登录 辅导 员 选 择 自己 管理 的 班级 ,查询 出 该 班级 所 有 的 学 生 信 息 ; 
当 不 选择 班级 编号 时 ,查询 出 登录 辅导 员 所 管理 的 所 有 班级 的 所 有 学 生 信息 。 图 11. 45 显 
示 了 7 号 辅导 员 用 户 管理 了 3 个 班级 1006101 班 .1006102 班 .1106101 班 。 

(2) 成 绩 查询 : 根据 选择 的 学 期 班级 编号 或 者 输入 的 学 号 ,查询 学 生 的 成 绩 。 如 果 





233 














数据 库 原理 及 应 用 



















































































€ 人 O | pocaihost49815mstudof 四 碌 | 三 TT 
学 校 通知 
班级 信息 
课程 信息 
教师 信息 
学 生 信 息 
成 绩 吉 询 
家 长 信息 
说 话 j 录 
修改 密码 
退出 系统 
图 11.44 辅导 员 主 界面 
€ 2 © Tiocahostt98ts/instrucaorFramesethtm 衣 | 三 QB 
学 生 信息 查询 
i 班级 编号 : v EE 
EM [学 辟建 克 [请 志 话 避 到 电子 部 作 更 缉 畏 导 员 编 司 
课程 信息 。 |100610101 凡 6 字 |21 1006101|7 
100610102| 张 兴 则 |20 100610117 
教师 信息 。 |100610103| 李 区 德 |20 10061017 
学 生 信 100610201J 存 揭 20 10061027 
ee 100610202 访 | 匣 “|21 10061027 
成 绩 查 询 。。“|110610101 浴 天 |21 11061017 
网 110610102| 张 三 飞 20 11061017 
讽 话 i 录 
修改 密码 
退出 系统 











11.45 ”学生 信息 查询 


只 选择 学 期 , 则 查询 出 该 辅导 员 该 学 期 所 有 班级 的 所 有 学 生成 绩 ; 如 果 只 选择 班级 编号 ， 
则 查询 出 该 班级 所 有 学 生 的 所 有 学 期 成 绩 。 图 11. 46 显示 1006101 班 的 学 生成 绩 ;也 可 
以 只 输入 学 号 ,查询 某 个 学 生 的 所 有 成 绩 ;或 者 输入 学 号 ,根据 所 选择 的 学 期 ,查询 出 该 学 
生 这 个 学 期 的 所 有 课程 成 绩 ; 当 不 做 任何 选择 ,也 不 输入 学 号 时 , 则 查询 出 该 辅导 员 管 理 
的 所 有 班级 的 所 有 学 生 的 所 有 学 期 的 成 绩 , 如 图 11. 47 所 示 。 

(3) 家 长 信息 查询 : 根据 选择 的 班级 查询 出 该 班级 所 有 家 长 的 信息 ,包括 学 生 学 号 、 
学 生 姓 名 、 家 长 姓名 、 地 址 及 联系 方式 等 ; 当 不 选择 班级 时 , 则 查询 出 该 管理 员 管理 的 所 有 
班级 的 学 生 的 家 长 信息 。 图 11. 48 显示 了 1006101 班 的 学 生 张 兴 则 的 家 长 的 联系 方式 以 
及 1006102 班 的 学 生 刘 存 鹏 的 家 长 的 联系 方式 。 
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€t 3 © | iocalnost45981instudorfamesethtml KI 三 四 @ 
成 绩 查 询 

学术 通知 。 学 年 学 期 ， 可 班级 编号 [7006107 | 学 EE 

级 信 学 号 | 姓名 | 班 纯 | 学 期 名 字 “[ 麻 程 编 引 课程 名 称 /成绩 

课程 信息 100610102 张 兴 则 |1006101|2014 年 上 学 期 |8 计算 机 网 络 |90 
100610103| 李 闪 德 1006101|2014 年 下 学 期 6 库 |78 

师 信 100610103 地 兴 德 |1006101|2014 年 上 学 期 | 计算 机 网 络 91 

学 生 信 息 100610101 凡 9 宇 |1006101|2014 年 下 学 期 |5 数据 库 。 |82 
100610101 刘 | 鸿 宇 |10061012014 年 上 学 期 | | 计算 机 网 络 |69 

成 绩 查 询 100610102| 张 兴 则 |1006101|2014 年 下 学 期 |6 库 ”|56 

家 长 信息 

说 证 记录 

修改 密码 

退出 系统 








图 11.46 辅导 员 成 绩 查询 一 




























































































€t 3 © | lochast4981VinstrudorFramesethtml WAI 三 四 SO… 
学 年 学 期 ， J| 班级 编号 悦 学 查看 
tl 学 号 | 姓名 | 班 号 ”学 期 名 字 课程 编号 课程 名 称 成绩 
组 信 100610201 风 J 存 毅 |10061022011 年 上 学 期 |1 计算 机 基础 |78 
100610201 则 存 关 |10061022011 年 下 学 期 2 大 学 英语 |86 
课程 信息 100610201J 存 毅 |10061022012 年 上 学 期 |5 数据 结构 “|78 
Re 100610202 风 | 艇 |10061022011 年 上 学 期 |1 计算 机 基础 |89 
100610202 则 版 ”|10061022011 年 下 学 期 2 | 大 学 英语 |90 
学 生 信 息 100610201| 存 毅 |10061022014 年 上 学 期 | 计算 机 网 络 |68 
110610101 李 天 “|11061012014 年 上 学 期 计算 机 网 络 | 89 
[成 绑 查 询 100610102 张 兴 则 |10061012014 年 上 学 期 8 计算 机 网 络 |90 
家 长 信息 110610101 订 天 “|11061012011 年 上 学 期 |1 计算 机 基础 |82 
110610101 李 天 “|11061012011 年 上 学 期 |1 计算 机 基础 |82 
| 谈话 记录 110610101| 李 天 “|11061012012 年 上 学 期 |3 | 高 等 数学 上 |54 
A 110610101 示 天 “|11061012012 年 上 学 期 6 获 据 库 |50 
上 下 二 双 110610101 认 天 “|11061012014 年 上 学 期 | | 数据 结构 “|49 
| 退出 系 坑 110610101| 李 天 “|11061012014 年 上 学 期 2 | 大 学 英语 |45 
110610102| 张 三 飞 |11061012011 年 上 学 期 |1 计算 机 基础 56 





























图 11.47 辅导 员 成 绩 查询 二 


(4) 谈话 记录 : 图 11. 49 列 出 了 该 登录 辅导 员 管 理 的 班级 中 每 个 学 期 需要 谈话 的 学 
生 信 息 , 显 示 学 生 的 学 生 编 号 、 学 期 编号 及 不 及 格 课程 数量 。 


4. 管理 员 功 能 模块 


管理 员 功 能 模块 窗口 如 图 11. 50 所 示 。 管 理 员 用 户 输入 账号 及 密码 登录 后 进入 管理 
员 主 界面 ,该 模块 实现 通知 管理 ,班级 管理 .课程 管理 .教师 管理 .学 生 管理 、 家 长 管理 ,学 
期 管理 .专业 管理 ,学 院 管理 ,授课 管理 以 及 统计 分 析 。 

(1) 课程 管理 : 实现 课程 信息 的 查询 、 添 加、 删除 及 修改 ,如 图 11. 51 所 示 。 

新 增 课程 信息 界面 如 图 11. 52 所 示 。 
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€ 人 ©O | iocahost4o8is/nstudorframeseth 种 广 | 三 四 QQ "1 
家 长 信息 查询 
学 校 通知 班级 编号 : I ED 























导 员 编号 | 





学 号 | 姓名 | 班 号 家 长 姓名 家 庭 地 十 | 电 i 
课程 信息 。 ”|100610102| 张 兴 则 |1006101| 郭 德 红 ”| 湖南 省 长 沙市 |0731-456|7 







































































ee 100610201| 刘 存 鹏 |1006102 刚 翔 ”I 上 海 027-654 |7 
学 生 信息 
成 绩 查询 
家 长 信息 
谈话 jp 时 
修改 密码 
退出 系统 
图 11.48 家 长 信息 查询 页 面 
[EE SS © Tiocahortasmina WRT 三 WO 
i floc1o0ah 
班级 信息 。 110610102|1 昌 
110610201|1 
课程 信息 
师 信 
学 生 信息 
| 成绩 查询 
家 长 信息 
谈话 jf 显 
| 修改 密码 
| 退出 系统 











11.49 家 长 谈话 记录 查询 


(2) 统计 分 析 : 主要 包括 分 班级 分 课程 课程 成 绩 图 表 、 班 级 成 绩 分 析 、 学 生 分 析 , 如 
11. 53 所 示 。 

@ 分 班级 分 课程 : 查询 各 个 班级 各 门 课 程 学 生 的 成 绩 情况 ,如 图 11. 54 所 示 ,查询 出 
1106101 班 的 计算 机 基础 课程 学 生 的 成 绩 情况 ,而 且 成 绩 从 低 到 高 输出 。 

其 主要 代码 如 下 : 


if (kecheng !=""&&gbanji!="") 
# 
SqlConnection cn=new 
SqlConnection("server= localhost;database= chengji;user= sa;password= 
123456"); 
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图 11.50 管理 员 功 能 模块 窗口 















































通知 管理 
班级 管理 
课程 管理 。 “| 添加 课程 
教师 管理 删除 课程 
学生 管 理 。 修改 课 各 
家 长 管理 。。 查询 课程 
学 期 惫 理 
专业 管理 
学院 管理 
授课 管理 
统计 分 析 
图 11.51 课程 管理 
€ 3 © | ecaihcst4oslsadminmairamezase 四 家 | 三 a 
- 录入 课程 一 四 
课程 编号 
课程 名 称 : 
学 分 
学 时 
EI 





图 11.52 新 增 课程 信息 界面 


SqlConmmand cmd=new SqlCommand ("SELECT 授课 学 期 ,课程 编号 ,课程 名 称 ,班级 编号 ,学 号 ,成 
绩 FROM 教师 成 绩 查询 信息 WHERE 课程 编号 ='"+ kecheng + “"'AND 班级 编号 = '"+banji+"" 
ORDER BY 成 绩 "，cn) ; 

SqlDataadapter da=new SqlDataAdapter (cmd) 7 

DataSet ds=new DataSet (); 

da.Fill(ds，"questions")7 

GridView] .DataSource=ds.Tables[0] .DefaultView; 
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图 11.53 统计 分 析 




















€ > ©O |localhost4815/adminmaintrame20.asp 女 | 三 js 
成 绩 查 询 
课程 名 和 计算 机 号 直 。 “| 班级 编号 [7105107 Y] [ 划 要 | 
授 刘 学 期 课程 这 号 | 课程 名 称 斑 级 编号 。 学 号 ”| 成 绩 
[2011 年 上 学 期 |1 计算 机 基础 1106101 |110610102|56 
2011 年 上 学 期 |1 计算 机 基础 1106101 |110610101|82 
P2011 年 上 学 骨 |1 1106101 |110610101|82 



































图 11.54 分 班级 分 课程 成 绩 情况 


GridView]l .Visible=true; 
GridView]l .DataBind(); 
} 


@ 课程 成 绩 图 表 : 分 班级 分 课程 以 图 表 的 形式 显示 该 班级 该 课程 的 成 绩 分 布 情况 ， 
如 图 11.55 和 图 11.56 所 示 , 显 示 出 1006101 班 的 数据 库 课程 的 成 绩 分 布 ,等 级 良好 1 
个 ,等 级 不 及 格 1 个 ,等 级 中 1 个 ;1106101 班 计算 机 基础 课程 的 成 绩 分 布 ,等 级 良好 2 
个 ,等 级 不 及 格 1 个 。 





























€ > ©O | iocaihost49815/adminmainframe20 1aspx 从 本 Q 
不及 格 人 数 ， 1 及 格 人 数 ，0 中 ，0 良 好 ，2 优 ，0 
成 绩 查 询 
课程 名 称 | 计算 机 基础 。 “] 班级 编号 [1106101 ~v] | 查看 
良 2 
优 0 
R 相 0 不 及 格 1 











11. 56 分 班级 分 课程 图 表 二 
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€ 2 OO | iocaihos49815/adminmainframe20 1.aspx 六 | 
不 及 格 人 数 ， 1 及 格 人 数 ， 0 中 ，1 良 好 ，1 优 ，0 


中 
民 
他 








课程 名 和 | 数据 库 ~] 班级 编号 [1006101 ~] |[ 喜 要 














及 格 0 不 及 格 1 








图 11.55 分 班级 分 课程 图 表 一 


其 主要 代码 如 下 : 


if (kecheng ! 
{ 


SqlConnection cn=new 





&banji!="") 


SqlConnection ("server= localhost;database= chengji;user= sa;password= 
123456"); 
SqlCommand cmd=new SqlConmand ("class_course grade3 ", cn); 
// 存 储 过 程 的 名 字 class_course_grade3 
cmd.ConmmandType= CommandType.StoredProcedure; 
// 所 要 执行 的 soL 语句 的 类 型 为 存储 


过 程 
cmd.Parameters.Add ("@ class", SqlDbType.VarChar); 

// 设 置 存储 过 程 的 输入 参数 @ class 
cmd.Parameters .Add ("@ course", SqlDbType.VarChar); 

// 设 置 存储 过 程 的 输入 参数 @ course 


cmd.Parameters .Add (new SqlParameter ("@ notpass", SqlDbType.Int, 4, 
ParameterDirection.Output, false, 0, 0, null, DataRowVersion.Default, null)); 

// 设 置 存储 过 程 的 输出 参数 enotpass 
cmd.Parameters .Add (new SqlParameter ("@ pass", SqlDbType.Int, 4, 
ParameterDirection.Output, false, 0, 0, null, DataRowVersion.Default, null)); 

// 设 置 存 储 过 程 的 输出 参数 epass 
cmd.Parameters .RMdd (new SqlParameter ("@ avg", SqlDbType.Int, 4, 
ParameterDirection.Output，false，0，0，nul1，DataRowVersion.Default，nul1))7 

// 设 置 存储 过 程 的 输出 参数 eavg 
cmd.Parameters .Rdd (new SqlParameter ("@ good", SqlDbType.Int, 4, 
ParameterDirection.Output，false，0，0，nul1，DataRowVersion.Default，nul1))7 

// 设 置 存 储 过 程 的 输出 参数 @ good 
cmd.Parameters .Add (new SqlParameter ("@ excellent", SqlDbType.Int, 4, 
ParameterDirection.Output, false, 0, 0, null, DataRowVersion.Default, null)); 


// 设 置 存储 过 程 的 输出 参数 eexcellent 
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cn.Open(); 


cmd.Parameters["@ class"] .Value=banji; 


cmd.Parameters["@ course"] .Value= kecheng; 


cmd .ExecuteNonQuery (); 


Response.Write ("良好 :"+1iang); 


Response.Write(" 优 :"+you); 
ydata.Add (bujige); 


ydata.Agdd(j 


ige); 


ydata.Agd (zhong); 


ydata.Agd (1 


iang); 


ydata.Add (you); 
Chart1.Series [0] ["PieLabelStyle"]= "Outside"; 
Chart1.Series [0] ["PieLineColor"]="Black"; 
Chart1.Series [0] .Points.DataBindXY (xdata ,ydata); 


Chartl .Visible=true; 


cn.Close(); 


} 


// 打 开 连 接 字符 串 

// 给 存储 过 程 的 输入 参数 赋值 
// 给 存储 过 程 的 输入 参数 赋值 
// 执 行 存储 过 程 
bujige=Convert.ToInt32 (cmd.Parameters["@ notpass"] .Value); 
jige=Convert .ToInt32 (cmd.Parameters["@ pass"] .Value); 
zhong= Convert.ToInt32 (cmd.Parameters["@ avg"] .Value); 
liang= Convert.ToInt32 (cmd.Parameters["@ good"] .Value); 
You= Convert.ToInt32 (cmd.Parameters["@ excellent"] .Value); 
Response.Write ("不 及 格 人 数 : "+bujige); 
Response.Write ("及 格 人 数 : "+jige); 
Response.Write ("中 :"+zhong); 


// 获 取 输 出 参数 的 值 
// 获 取 输 出 参数 的 值 
// 获 取 输 出 参数 的 值 
// 获 取 输 出 参数 的 值 
// 获 取 输 出 参数 的 值 


// 给 饼 图 y 轴 赋值 
// 给 饼 图 y 轴 赋值 
// 给 饼 图 y 轴 赋值 
// 给 饼 图 y 轴 赋值 
// 给 饼 图 y 轴 赋值 


@@ 班级 成 绩 分 析 : 查询 出 选择 的 班级 所 有 学 生 的 所 有 课程 的 成 绩 以 及 总 分 ,并 按照 总 
分 从 低 到 高 排序 ,如 图 11. 57 所 示 , 列 出 了 1106101 班 所 有 学 生 的 所 有 课程 的 成 绩 及 总 分 。 






























































€ 2 ©O | localhost49815/adminmaintramed0aspx 让 | 三 各 
成 绩 查询 
班级 编号 [1106101 ~] [ 喜 要 
学 号 ”大 学 英语 高 等 歼 学 上 和 高 等 数学 下 | 计算 机 基础 计算 机 通信 技术 | 计算 机 网 络 数 据 结 构 栈 据 库 数据 控 沁 总 分 
1106101020 50 0 156 po 0 0 0 0 106 
11061010145 |54 0 82 pb |89 149 |50 0 1451 
图 11.57 班级 总 体 成 绩 情况 
其 主要 代码 如 下 : 
if (banji!="") 


{ 


string sql= "class grade analysis"7 


SqlConnection cn=new 


SqlConnection ("server= localhost;database= chengji;user= sa;password= 


123456" 


) 7 


SqlCommand sqlcmd= new SqlCommand (sql, cn); 


数据 库 设计 


Sqlcmd .CommandType= CommandType.StoredProcedure; 
SqlParameter sqlPa= sqland.Parameters.RMad("@ class", SqlDblype .VarChar, 20); 
SqlPa.Value=banji; 
cn-Open (); 
SqlDataAdapter da=new SqlDataAdapter (sqlcmd); 
DataSet ds=new DataSet (); 
da.Fill (ds, "questions"); 
GridView1.DataSource=ds.Tables[0] .DefaultView; 
GridView1.Visible=true” 
GridView] .DataBind(); 

} 


@ 查询 每 个 学 生 的 所 有 成 绩 ,根据 管理 员 输 入 的 学 号 ,获取 该 学 生 所 有 学 期 所 有 课 
程 的 成 绩 。 图 11. 58 列 出 了 1106101 班 01 号 学 生 的 所 有 课程 的 成 绩 。 





€ 2 O | iocalhost49815lat 








输入 学 生 编号 ， [110610101 直 看 














学 号 “课程 编号 课程 名 称 | 学 期 名 字 | 成绩 
1106101011 计算 机 基础 2011 年 上 学 期 |82 
1106101011 | 计算 机 基础 2011 年 上 学 期 |82 
1106101013 高 等 效 学 上 |2012 年 上 学 期 |34 
1106101016 数据 库 。” |2012 年 上 学 期 50 
1106101018 计算 机 网 络 2014 年 上 学 期 |89 
1106101017 牙 据 结构 “|2014 年 上 学 期 /49 

1106101012 大 学 英语 |2014 年 上 学 期 |45 















































图 11.58 学 生成 绩 查 
和 理 员 用 户 的 其 他 模块 功能 和 前 寅 增加 洲 的 席 积 信 息 模 块 类 似 ， 这 里 不 一 一 介绍 了 。 


11.9 小 结 


本 章 主要 讨论 数据 库 设计 的 全 过 程 , 包 括 需求 分 析 、 概 念 结构 设计 、 逻 辑 结构 设计 、 物 
理 结构 设计 数据 库 实施 ,数据库 运行 和 维护 ,并 在 本 章 的 最 后 给 出 一 个 学 生成 绩 管理 系 
统 的 应 用 案例 ,该 案例 非常 详细 地 描述 了 数据 库 设计 的 全 过 程 实施 情况 ,在 该 案例 中 还 创 
建 了 大 量 的 数据 库 对 象 ,包含 表 、 视 图 、 存 储 过 程 触 发 器 。 

需求 分 析 是 数据 库 设计 的 第 一 阶段 ,在 该 阶段 需要 进行 详细 的 用 户 需 求 调查 ,编写 用 
户 需求 说 明 书 ,绘制 数据 流 图 .数据 字典 等 来 描述 用 户 的 需求 。 

结构 设计 是 在 需求 分 析 的 基础 上 对 现实 世界 的 抽象 和 模拟 ,一 般 都 采用 E-R 模 

型 表示 。 先 设计 出 局 部 E-R 模型 ,在 整合 成 全 局 E-R 模型 后 ,再 对 全 局 E-R 模型 进行 
优化 。 

逻辑 结构 设计 是 把 概念 结构 设计 出 的 全 局 E-R 模型 转换 为 具体 的 DBMS 支持 的 数 
据 模型 ,并 应 用 规范 化 理论 进行 优化 , 除 此 之 外 ,还 须 设计 出 用 户 的 子 模式 。 

物理 结构 设计 根据 选 定 的 DBMS 及 应 用 要 求 设计 出 数据 库 的 存 取 方法 、 存 储 结构 、 
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存放 位 置 ,并 进行 相应 的 系统 配置 。 

数据 库 的 实施 过 程 包括 创建 数据 库 结构 ,数据 载 入 、 应 用 程序 编码 及 调试 编写 文档 、 
数据 库 试 运行 几 个 阶段 。 

数据 库 运行 和 维护 阶段 的 主要 工作 包括 数据 库 的 转 储 和 恢复 、 数 据 库 的 安全 性 和 完 
整 性 控制 .数据库 性 能 监控 分 析 与 改进 数据库 的 重组 织 与 重 构造 。 


11.10 习题 


. 简 述 数据 库 设计 有 哪些 方法 。 

. 规范 化 数据 库 设计 有 哪些 阶段 ? 简 述 各 个 阶段 的 任务 是 什么 。 

. 需求 分 析 阶 段 的 设计 目标 是 什么 ”调查 的 内 容 是 什么 ? 

. 简 述 数据 字典 的 内 容 和 作用 。 

. 什么 是 数据 库 的 概念 结构 ? 简 述 其 步骤 。 

. 合并 局 部 E-R 图 到 全 局 E-R 图 时 应 该 注意 什么 ? 

. 简 述 逻 辑 结构 设计 的 内 容 和 步骤 。 

. 简 述 规范 化 理论 在 数据 库 设计 中 起 到 的 作用 。 

. 简 述 数据 库 物 理 设计 的 内 容 和 步骤 。 

10. 什么 是 数据 库 的 重组 织 和 重 构造 ?为 什么 要 进行 重组 织 和 重 构造 ? 


Oo 人 wr- 
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本 篇 介绍 数据 库 系统 管理 部 分 的 内 容 。 

本 篇 包含 以 下 章节 。 

第 12 章 并 发 控制 ,主要 内 容 : 并 发 操作 带 来 的 3 类 问题 、 封 
锁 类 型 .三 级 封锁 协议 、 两 段 锁 协议 、 多 粒度 封锁 与 意向 锁 。 

第 13 章 ”数据 库存 储 技术 ,主要 内 容 ; 数据 库 系 统 存储 结构 
与 存储 介质 、 数 据 文件 的 记录 格式 、 数 据 文件 格式 、.B+ 树 索引 文件 、 
散 列 索引 文件 。 

第 14 章 关系 查询 优化 ,主要 内 容 : 查询 处 理 的 基本 步骤 、 查 
询 代 价 度量 、 代 数 优化 等 价 变 换 规则 及 代数 优化 算法 、 物 理 优 化 的 
一 般 启发 式 规则 。 

第 15 章 数据库 安全 ,主要 内 容 : 数据 库 系 统 安全 标准 、 数 据 
库 系 统 安全 模型 、 存 取 控 制 机 制 、 自 主 存 取 控 制 、 角 色 、 审 计 、 强 制 存 
取 控 制 . 视 图 机 制 .数据 加 密 。 

第 16 章 数据 库 恢 复 , 主 要 内 容 : 数据 库 恢复 概述 、 故 障 类 
型 恢复 的 基本 原理 与 实现 方法 、 数 据 转 储 、 建 立 日 志 \ 日 志 技 术 下 
的 事务 故障 、 系 统 故障 以 及 介质 故障 恢复 算法 。 


第 12 章 并 发 控制 


本 章 讨论 数据 库 管 理 系统 的 并 发 控制 , 稍 后 在 第 16 章 讨 论 数据 库 恢复 技术 ,并 发 控 
制 与 数据 库 恢 复 的 基本 单位 都 是 事务 (transaction) ,其 中 12. 1 节 介 绍 事务 ,12. 2 节 一 12.5 
节 讨 论 并 发 控制 。 


12.1 事务 


本 节 讨 论 事务 的 概念 与 性 质 。 数 据 库 系统 中 ,从 用 户 角 度 看 ,账户 A 到 账户 B 的 一 
次 转账 是 一 个 操作 ;而 在 数据 库 管理 系统 角度 ,这 是 由 账户 A 余额 的 更 新 操作 (减少 ) 与 
账户 B 余额 (增加 账户 A 等 量 的 减少 值 ) 的 更 新 操作 组 成 的 。 这 两 个 操作 要 么 全 做 ,要 人 么 
全 部 不 做 。 资 金 从 账户 A 转 出 但 未 转 和 账户 B 的 情况 是 不 可 接受 的 。 不 能 分 开 执 行 的 
操作 就 是 一 个 事务 。 


12.1.1 事务 的 概念 


事务 是 用 户 定义 的 构成 单一 逻辑 工作 单元 的 数据 库 操作 集合 。 集 合 里 的 操作 要 么 全 
部 执行 ,要 么 根本 不 执行 ,是 一 个 不 可 分 割 的 工作 单位 。 

应 用 程序 的 用 户 数 据 处 理 需求 ,到 了 数据 库 系统 内 部 就 是 正确 高 效 地 执行 事务 。 事 
务 是 数据 库 管理 系统 的 逻辑 工作 单元 ,相当 于 操作 系统 环境 中 进程 的 概念 。 

一 个 事务 由 应 用 程序 中 的 一 组 操作 序列 组 成 ,在 程序 中 ,事务 以 BEGIN TRANSACTION 
语句 开始 ,以 COMMIT 语句 或 者 ROLLBACK 语句 结束 。COMMIT 语句 表示 事务 执行 
成 功 地 结束 (提交 ) ,此 时 告诉 系统 ,数据 库 要 进入 一 个 新 的 正确 状态 ,该 事务 对 数据 库 的 
所 有 更 新 都 已 交付 实施 并 写 入 磁盘。ROLLBACK 语句 表示 事务 执行 不 成 功 地 结束 ,也 
称 为 回 滚 , 此 时 告诉 系统 ,事务 运行 过 程 中 发 生 了 错误 ,数据库 可 能 处 于 不 正确 的 状态 ,该 
事务 对 数据 库 的 所 有 更 新 必须 被 撤销 ,数据 库 应 恢复 该 事务 到 初始 状态 。 

如 果 用 户 没有 显 式 地 定义 事务 ,数据 库 管理 系统 就 按照 默认 规则 自动 划分 事务 。 





12.1.2 事务 的 ACID 性 质 

事务 具有 4 个 特性 : 原子 性 (Atomicity) 一致 性 (Consistency)、 隔 离 性 (Isolation) 和 
持续 性 (Durability) , 合 称 为 ACID 特性 。 

1. 原子 性 

事务 作为 数据 库 的 逻辑 工作 单元 ,事务 内 部 包含 的 数据 库 操作 集合 必须 作为 单一 的 
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不 可 分 割 的 单元 ,要 么 全 部 被 执行 ,要 么 根本 不 被 执行 。 如 果 一 个 事务 开始 执行 ,但 是 由 
于 某 些 原因 不 能 达到 终点 ,该 事务 对 数据 库 造成 的 任何 可 能 的 修改 都 要 撤销 。 确 保 原子 
性 要 求 是 困难 的 ,因为 对 数据 库 的 一 些 修改 可 能 仅 存在 于 事务 的 内 存 变 量 中 ,而 另外 一 些 
已 经 写 和 数据库 并 存储 到 磁盘 上 。 这 种 全 或 无 的 特性 称 为 原子 性 。 


2. 一 致 性 


一 个 事务 独立 执行 的 结果 ,应 该 保持 数据 库 的 一 致 性 , 即 数据 库 从 一 个 一 致 性 状态 变 到 
另 一 个 一 致 性 状态 。 数 据 不 会 因为 事务 的 执行 而 遭受 破坏 。 确 保 旬 辑 上 事务 的 一 致 性 是 纺 
写 事务 的 应 用 程序 员 的 职责 。 而 运行 时 的 一 致 性 由 数据 库 管理 系统 完整 性 子 系统 测试 。 


3. 隔离 性 


事务 总 是 并 发 执行 的 ,单个 事务 的 执行 不 能 被 其 他 事务 干扰 , 即 一 个 事务 的 一 个 事务 
内 部 的 操作 及 使 用 的 数据 对 其 他 并 发 事务 是 隔离 的 。 在 多 个 事务 执行 时 ,系统 应 该 保证 
其 执行 结果 与 这 些 事务 先后 单独 执行 时 的 结果 一 样 ,也 就 是 如 同 单 用 户 环境 一 样 。 


4. 持续 性 


一 个 事务 一 旦 提交 , 它 对 数据 库 的 所 有 更 新 就 应 该 永久 地 反映 在 数据 库 中 。 接 下 来 
的 其 他 操作 不 应 该 对 其 执行 结果 有 任何 影响 。 即 使 以 后 系统 发 生 故 障 ,该 事务 的 执行 也 
不 受 影响 。 


12.2 并 发 控制 


为 提高 数据 库 系统 的 效率 ,事务 需要 并 发 执行 。 如 果 对 并 发 操作 不 加 以 控制 , 则 有 可 
能 破坏 并 发 事务 的 ACID 性 质 。 





12.2.1 事务 并 发 执行 的 必要 性 

如 果 事 务 串 行 执行 , 即 一 个 接 一 个 地 执行 事务 ,系统 处 理 肯定 可 以 保证 ACID 性 质 。 
然而 ,DBMS 事务 处 理 系 统 通常 允许 多 个 事务 并 发 执行 ,其 原因 或 者 并 发 必要 性 如 下 。 

1. 提高 香 吐 量 和 资源 利用 率 


事务 是 一 个 逻辑 工作 单元 ,包含 一 个 数据 库 操作 序列 。 事 务 中 的 I/O 操作 可 以 与 
CPU 处 理 并 行进 行 ,从 而 提高 系统 吞吐 量 。 例 如 ,单位 时 间 片 内 ,事务 A 在 进行 磁盘 读 
写 ,事务 C 在 另 一 张 磁盘 上 进行 读 写 。 相 应 地 ,处 理 器 与 磁盘 利用 率 也 得 到 提高 。 


2. 减少 等 待 时 间 


系统 中 运行 着 各 种 各 样 的 事务 ,长短 不 一 。 让 它们 并 发 执行 ,事务 之 间 共 享 CPU 周 
期 与 磁盘 存 取 。 并 发 执行 可 以 减少 执行 事务 时 不 可 预测 的 延迟 。 此 外 ,也 可 以 减少 平均 
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响应 时 间 , 即 一 个 事务 从 提交 到 完成 所 需要 的 平均 时 间 。 

在 数据 库 中 进行 并 发 事务 与 操作 系统 中 使 用 多 道 程序 的 思想 其 实 是 一 样 的 。 多 个 事 
务 并 发 执行 时 ,可 能 违背 隔离 性 ,这 导致 即便 每 个 事务 都 正确 执行 ,数据 库 的 一 致 性 也 可 
能 被 破坏 。 


12.2.2 并 发 操作 带 来 的 问题 


并 发 操作 会 带 来 一 系列 问题 。 
1. 丢失 更 新 


丢失 更 新 (lost update) 是 指 事务 1 与 事务 2 从 数据 库 中 读 入 同一 数据 并 修改 ,事务 2 
的 提交 结果 破坏 了 事务 1 的 提交 结果 ,导致 事务 1 的 修改 被 丢失 。 例 如 ,在 图 12. 1 中 ,A 
的 初 值 为 100, 事 务 T1 将 数据 库 中 A 的 值 减少 50, 事 务 T2 将 数据 库 中 A 的 值 减少 40。 
无 论 执行 次 序 是 先 Tl 后 T2, 或 者 是 先 T2 后 T1,A 的 值 都 是 10。 但 是 ,按照 图 12. 1 中 
的 并 发 操作 序列 执行 ,A 的 结果 是 60, 这 是 错误 的 ,因为 丢失 了 事务 T1 对 数据 库 的 更 新 ， 
因而 这 个 并 发 操作 不 是 正确 的 。 


事务 T1 事务 T2 
read (4 )，4 的 值 为 100 











read (4)，4 的 值 为 100 





A:=A-50 
write (4 )，4 的 值 为 50 








4:=4-40 
write (4), 4 的 值 为 60 


图 12.1 丢失 更 新 示例 














2. 读 脏 数据 


事务 1 修改 某 一 数据 ,并 将 其 写 回 磁盘 。 事 务 2 读 取 同 一 数据 后 ,事务 1 由 于 某 种 原因 
被 撤销 ,这 时 事务 1 已 修改 过 的 数据 恢复 原 值 ,事务 2 读 到 的 数据 就 与 数据 库 中 的 数据 不 一 
致 ,是 不 正确 的 数据 , 称 为 “ 脏 数 据 *”。 例 如 ,在 图 12.2 中 ,B 的 初 值 为 100, 事 务 T1 将 B 值 
修改 为 200, 事 务 T2 读 到 B 为 200, 随 后 事务 Tl 由 于 某 种 原因 撤销 ,其 修改 回 滚 撤 销 ,B 的 
事务 Tl 事务 T2 
read (8)，B 的 值 为 100 

B:=B*2 
write (8), B 的 值 为 200 

















read(B)，B 的 值 为 200 





ROLLBACK, B 的 值 为 100 











图 12.2 读 脏 数据 示例 
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值 恢复 为 100, 这 时 T2 读 到 的 B 为 200, 与 数据 库 内 容 不 一 致 , 读 到 了 “ 脏 数据 ”。 
3. 不 可 重复 读 


不 可 重复 读 (non-repeatable read) 是 指 事务 1 读 取 数据 后 ,事务 2 执行 更 新 操作 ,使 
事务 1 无 法 再 现 前 一 次 的 读 取 结 果 。 

具体 地 讲 , 有 3 类 不 可 重复 读 。 

(1) 当 事 务 1 读 取 某 一 数据 后 ,事务 2 对 其 做 了 修改 , 当 事 务 1 再 次 读 该 数据 时 ,得 
到 与 前 一 次 不 同 的 值 。 例 如 ,在 图 12. 3 中 ,C 的 初 值 为 100 ,事务 Tl 读 到 C 的 值 为 100， 
事务 T2 读 到 C 的 值 为 100 ,并 修改 为 200, 写 回 数据 库 。T1 为 了 校 验 ,再 次 读 取 C ,发 现 
C 的 值 为 200, 与 第 一 次 读 取 的 值 不 一 样 ,不 可 重复 读 。 











事务 TI [事务 2 
read(C), C 的 值 为 100 | 
| read(C) 
[c=c*2 
| write (C)，C 的 值 为 200 
| CoMMIT 
read(C), C 的 值 为 200 | 


12.3 不 可 重复 读 示例 


(2) 当 事 务 1 按 一 定 条 件 从 数据 库 中 读 取 了 某 些 数据 记录 后 ,事务 2 删除 了 其 中 部 
分 记录 , 当 事 务 1 再 次 按 相同 条 件 读 取 数据 时 ,发 现 某 些 记录 神秘 地 消失 了 。 

(3) 当 事 务 1 按 一 定 条 件 从 数据 库 中 读 取 了 某 些 数据 记录 后 ,事务 2 插入 了 一 些 记 
录 , 当 事务 1 再 次 按 相同 条 件 读 取 数 据 时 ,发 现 多 了 一 些 记 录 。 

后 两 种 不 可 重复 读 有 时 也 称 为 幻影 现象 。 

产生 3 类 数据 不 一 致 的 主要 原因 是 并 发 操作 破坏 了 事务 的 隔离 性 。 并 发 控制 机 制 就 
是 要 用 正确 的 方式 调度 并 发 操作 ,使 一 个 用 户 事务 的 执行 不 受 其 他 事务 的 干扰 ,从 而 避免 
造成 数据 的 不 一 致 。 

从 另 一 方面 看 ,数据 库 应 用 有 时 为 了 保证 并 发 度 ,是 允许 某 些 不 一 致 的 。 例 如 ,有 些 
统计 工作 涉及 海量 数据 , 读 到 一 些 “ 脏 数据 "对 统计 精度 没有 什么 影响 ,这 可 以 适当 降低 一 
致 性 要 求 ,以 减少 系统 开销 。 





























12.2.3 并 发 事务 调度 可 串 行 化 


并 发 事务 调度 要 保证 数据 一 致 性 ,并 行 调度 必须 是 可 串 行 化 的 。 进 一 步 地 ,如 果 考 虑 
实际 并 发 操作 中 事务 故障 的 影响 ,要 保证 并 发 事务 调度 的 数据 一 致 性 ,并 行 调度 必须 是 可 
串 行 化 的 。 

事务 的 执行 次 序 称 为 调度 (schedule) 。 如 果 多 个 事务 依次 执行 , 则 称 为 事务 的 串 行 
调度 (serial schedule) 。 如 果 利 用 分 时 方法 ,同时 处 理 多 个 事务 , 则 称 为 事务 的 并 发 调度 
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(Concurrent Schedule) 。 

如 果 ?个 事务 串 行 调度 , 则 有 n! 种 不 同 的 有 效 调度 。 事 务 串 行 调度 的 结果 都 是 正 
确 的 ,至 于 依照 何 种 次 序 执行 ,是 随机 的 ,系统 无 法 预料 。 

如 果 n 个 事务 并 发 调度 ,可 能 的 并 发 调度 数目 远 远 大 于 n!。 但 其 中 有 的 并 发 调度 是 正 
确 的 ,有 的 是 不 正确 的 。 判 断 一 个 并 发 调度 是 不 是 正确 ,就 是 看 这 个 调度 是 不 是 可 串 行 化 。 

如 果 一 个 并 发 调度 的 执行 结果 与 某 一 串 行 调度 的 执行 结果 相同 ,那么 这 个 并 发 调度 
称 为 "可 串 行 化 的 调度 。 

【 例 12.1】 A 的 初 值 为 100, 事 务 T1 将 数据 库 中 A 的 值 减少 50, 事 务 T2 将 数据 库 
中 A 的 值 减少 40。 

考虑 串 行 调 度 , 先 执行 Tl 后 执行 T2,A 结果 值 为 10; 先 执行 T2 后 执行 T1,A 结果 
值 也 为 10。 

考虑 图 12. 1 的 并 发 调度 ,A 的 执行 结果 为 60 ,与 任何 一 个 串 行 调度 结果 都 不 一 样 ， 
因而 图 12. 1 的 并 发 调度 是 不 正确 的 ,这 个 并 发 调度 是 不 可 串 行 化 的 调度 。 只 有 并 发 调度 
执行 结果 为 10 时 , 才 是 正确 的 调度 , 即 可 串 行 化 的 调度 。 

数据 库 管 理 系统 广泛 采用 的 并 发 控制 技术 是 封锁 技术 。 


12.3 ”封锁 技术 


封锁 就 是 事务 T 在 对 某 个 数据 对 象 (如 表 、 记 录 等 ) 操 作 之 前 , 先 向 系统 发 出 请 求 , 对 
其 加 锁 。 加 锁 后 事务 T 就 对 该 数据 对 象 有 了 一 定 的 控制 ,确切 的 控制 由 封锁 的 类 型 决 
定 。 在 事务 T 释放 它 的 锁 之 前 ,其 他 事务 不 能 更 新 此 数据 对 象 。 

例如 ,在 图 12. 1 中 ,事务 Tl 修改 数据 A 之 前 , 先 对 它 加 锁 。 其 他 事务 就 不 能 再 读 取 
或 修改 数据 A 了 ,直到 事务 T1 完成 对 数据 A 的 修改 ,解除 对 数据 A 的 封锁 为 止 ,从 而 事 
务 Tl 的 修改 就 不 会 丢失 。 

基本 的 封锁 类 型 有 排他 锁 (Exclusive Locks,X 锁 ) 和 共享 锁 (Share Locks,S 锁 ) 两 种 。 


12.3.1 封锁 类 型 


1. 排他 锁 


排他 锁 又 称 写 锁 ,是 封锁 技术 中 最 常用 的 一 种 锁 。 

若 事务 T 对 数据 对 象 RCR 可 以 是 数据 项 记录、 关系 ,甚至 整个 数据 库 ) 加 上 X 锁 ， 
则 在 工 对 数据 R 释放 X 锁 之 前 ,只 允许 工读 取 和 修改 R, 其 他 任何 事务 都 不 能 再 对 R 加 
任何 类 型 的 锁 , 直 到 T 释 放 A 上 的 锁 。 

X 锁 的 操作 有 两 个 。 

(1) 封锁 操作 LockX(R)。 

表示 事务 对 数据 R 加 X 锁 ,并 读数 据 R。 随 之 ,该 事务 可 以 对 数据 R 实现 写 操作 。 
如 果 加 X 锁 操作 失败 ,那么 这 个 事务 进入 等 待 队列 。 
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(2) 解锁 操作 Unlock(R)。 

表示 事务 解除 对 数据 RR 的 X 锁 。 

采用 X 锁 的 并 发 控制 并 发 度 低 , 只 允许 一 个 事务 独占 数据 R, 而 其 他 申请 封锁 R 的 
事务 只 能 排队 去 等 ,为 此 降低 要 求 , 允 许 并 发 读 , 引 入 共享 锁 。 


2. 共享 锁 


共享 锁 又 称 读 锁 。 

若 事务 T 对 数据 对 象 R 加 上 S 锁 , 则 其 他 事务 仍然 可 以 对 R 加 S 锁 ,但 不 能 加 X 
锁 ,直到 T 以 及 其 他 事务 释放 R 上 的 所 有 S 锁 。 

S 锁 的 操作 有 3 个 。 

(1) 封锁 操作 LockSCR ) 。 

表示 事务 对 数据 R 加 S 锁 ,并 读数 据 R。 随 之 ,该 事务 只 能 读数 据 R, 不 能 对 数据 R 
实现 写 操作 。 如 果 加 S 锁 操 作 失败 ,那么 这 个 事务 进入 等 待 队列 。 

(2) 升级 和 写 操作 UpdX(R)。 

表示 事务 要 把 对 数据 R 的 S 锁 升级 为 X 锁 , 若 成 功 , 则 更 新 数据 尺 ,否则 这 个 事务 进 
入 等 待 队列 。 

(3) 解锁 操作 Unlock(R)。 

表示 事务 解除 对 数据 R 的 S 锁 。 

获准 S 锁 的 事务 只 能 读数 据 , 不 能 更 新 数据 , 若 要 更 新 , 则 先 把 S 锁 升 级 为 X 锁 


3. 锁 的 相 容 矩阵 


根据 X 锁 \S 锁 的 定义 ,可 以 得 出 封锁 类 型 的 相 容 矩阵 ,如 图 12. 4 所 示 。 首 先 事务 
T1 先 对 数据 做 出 某 种 封锁 或 者 不 加 封锁 ,然后 事务 T2 再 对 同一 个 数据 请 求 某 种 封锁 或 
不 加 封锁 。 图 中 的 Y 和 N 分 别 表示 它们 之 间 是 相 容 的 ,还 是 不 相 容 的 。 如 果 两 个 封锁 是 
不 相 容 的 ,后 提出 来 封锁 的 事务 就 需要 等 待 。 























Y=Yes, 相 容 的 请 求 
N=No, 不 相 容 的 请 求 























图 12.4 ”封锁 类 型 的 相 容 矩阵 


12.3.2 封锁 协议 














在 用 两 种 基本 封锁 (X 锁 和 S 锁 ) 对 数据 对 象 加 锁 时 ,需要 约定 一 些 规则 , 何 时 申请 X 
锁 或 S 锁 、 持 锁 时 间 、 何 时 释放 等 , 称 为 封锁 协议 (locking protocol) 。 
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不 同 的 封锁 协议 在 不 同 的 程度 上 为 并 发 操作 的 正确 调度 提供 保证 。 本 节 介 绍 常用 的 
三 级 封锁 协议 。12. 2. 2 节 中 提 到 并 发 操作 带 来 3 个 数据 不 一 致 问题 : 丢失 更 新 、 读 脏 数 
据 和 不 可 重复 读 。 三 级 封锁 协议 分 别 在 不 同 程度 上 解决 了 这 些 问 题 ,为 并 发 操作 的 正确 
执行 提供 不 同 程度 的 保证 。 


1. 一 级 封锁 协议 


一 级 封锁 协议 是 指 事务 T 在 修改 数据 R 之 前 必须 先 对 其 加 XX 锁 ,直到 事务 结束 才 释 
放 。 事 务 结束 包括 正常 结束 (COMMIT) 和 非 正常 结束 (ROLLBACK) 。 一 级 封锁 协议 可 
防止 丢失 更 新 ,并 保证 事务 是 可 以 恢复 的 。 

事务 T1 在 读 A 进行 修改 之 前 先 对 A 加 义 锁 , 当 T2 请 求 对 A 加 XX 锁 时 由 于 不 相 容 
被 拒绝 ,T2 进入 等 待 状态 ,直到 T1 释放 A 上 的 X 锁 后 才能 获得 对 A 上 的 X 锁 ,这 时 T2 
读 到 的 A 值 已 经 是 T1 更 新 过 的 值 50 ,继续 运行 ,将 A 的 值 减 去 40 写 回 磁盘 ,从 而 避免 
了 丢失 事务 T1 的 修改 。 

在 一 级 封锁 协议 中 ,如 果 是 读数 据 , 是 不 需要 加 锁 的 ,所 以 它 不 能 保证 可 重复 读 和 不 
读 “ 脏 ”数据 。 


2. 二 级 封锁 协议 


二 级 封锁 协议 是 指 在 一 级 封锁 协议 的 基础 上 增加 事务 T 在 读 取 数 据 R 前 必须 先 对 
其 加 S 锁 , 读 完 后 即 可 释放 S 锁 的 规则 。 二 级 封锁 协议 可 以 防止 丢失 更 新 和 读 脏 数据 。 
在 二 级 封锁 协议 中 ,由 于 读 完 数据 后 即 可 释放 S 锁 , 所 以 它 不 能 保证 可 重复 读 。 


3. 三 级 封锁 协议 


三 级 封锁 协议 是 指 在 一 级 封锁 协议 的 基础 上 增加 事务 T 在 读 取 数 据 R 之 前 必须 先 
对 其 加 S 锁 ,直到 事务 结束 才 释 放 的 规则 。 三 级 封锁 协议 除了 可 防止 丢失 更 新 和 读 脏 数 
据 , 还 进一步 防止 不 可 重复 读 。 

三 级 封锁 协议 的 主要 区 别 在 于 什么 操作 需要 申请 封锁 以 及 何 时 释放 封锁 , 即 持 锁 时 
间 。 三 级 封锁 协议 可 以 总 结 为 表 12.1。 封 锁 协 议 级 别 越 高 ,一 致 性 程度 越 高 。 

表 12.1 三 级 封锁 协议 与 一 致 性 级 别 
X 锁 S 锁 一 致 性 保证 


封锁 协议 | 操作 结束 | 事务 结束 | 操作 结束 | 事务 结束 
释放 释放 释放 释放 





不 丢失 更 新 不 读 脏 数据 | 可 重复 读 


























一 级 封锁 协议 ~V V 
二 级 封锁 协议 ~ ~ V ~ 
三 级 封锁 协议 JV JV ~V ~V V 


12.3.3 ”两 段 锁 协议 


如 12. 2. 3 节 所 述 ,为 了 保证 并 发 调度 的 正确 性 ,数据 库 管理 系统 的 并 发 控制 机 制 必 
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须 提供 一 定 的 手段 来 保证 调度 是 可 串 行 化 的 。 目 前 ,数据 库 管 理 系统 普遍 采用 两 段 锁 
(Two Phrase Locking,2PL) 协 议 来 实现 并 发 调度 的 可 串 行 性 ,从 而 保证 调度 的 正确 性 。 

两 段 锁 协议 是 指 所 有 事务 必须 分 两 个 阶段 对 数据 项 加 锁 和 解锁 。 在 对 任何 数据 进行 
读 、 写 操作 之 前 ,事务 首先 要 获得 对 该 数据 的 封锁 ;在 释放 一 个 封锁 之 后 ,事务 不 再 获得 任 
何其 他 封锁 。 

两 段 锁 协议 中 两 段 的 含义 是 指 : 事务 分 为 两 个 阶段 ,第 一 阶段 是 获得 封锁 ,也 称 为 扩 
展 阶段 ,在 这 个 阶段 ,事务 可 以 申请 获得 任何 数据 项 上 的 任何 类 型 的 锁 ,但 是 不 能 释放 任 
何 锁 ; 第 二 阶段 是 释放 封锁 ,也 称 为 收缩 阶段 ,在 这 个 阶段 ,事务 可 以 释放 任何 数据 项 上 的 
任何 类 型 的 锁 , 但 是 不 能 再 申请 任何 锁 。 

例如 ,事务 1 遵守 两 段 锁 协 议 , 其 封锁 序列 是 ,Slock A…Slock B…Xlock C…Unlock 
B…Unlock A…Unlock C。 

又 如 ,事务 2 不 遵守 两 段 锁 协 议 ,其 封锁 序列 是 Slock A…Unlock A… Slock B… 
Xlock C…Unlock C…Unlock B。 

可 以 证 明 , 若 并 发 执行 的 所 有 事务 均 遵 循 两 段 锁 协议 , 则 对 这 些 事务 的 任何 并 发 调度 
策略 都 是 可 串 行 化 的 。 事 务 遵 守 两 段 锁 协议 是 可 串 行 化 调度 的 充分 条 件 ,而 不 是 必要 
条 件 。 


12.4 封锁 带 来 的 问题 


封锁 技术 有 效 地 解决 了 并 行 操作 的 丢失 更 新 . 读 脏 数据 和 不 可 重复 读 等 一 致 性 问题 ， 
但 是 对 数据 对 象 进行 加 锁 控 制 也 会 带 来 新 的 问题 一 一 活 锁 和 死 锁 。 


12.4.1 活 锁 


如 果 事务 T1 封锁 了 数据 R, 事 务 T2 又 请 求 封锁 R, 于 是 T2 等 待 ;接着 ,事务 T3 也 
请 求 封锁 人 , 当 T1 释放 了 R 上 的 封锁 之 后 ,系统 首先 批准 了 T3 的 请 求 ,T2 仍然 等 待 ; 然 
后 T4 又 请 求 封 锁 R, 当 T3 释放 了 R 上 的 封锁 之 后 系统 又 批准 了 T4 的 请 求 ……T2 有 
可 能 永远 等 待 下 去 ,这 就 是 活 锁 。 

避免 活 锁 的 最 简单 方法 是 采用 先 来 先 服务 策略 。 当 多 个 事务 请 求 封锁 同一 数据 对 象 
时 , 锁 管理 器 按 请 求 封锁 的 先后 次 序 对 这 些 事务 排队 ,该 数据 对 象 上 的 锁 一 旦 释放 ,首先 
批准 申请 队列 中 第 一 个 事务 获得 锁 。 


12.4.2 死 锁 


如 果 存 在 一 个 事务 集 ,该 集合 中 的 每 个 事务 在 等 待 该 集合 中 的 另 一 个 事务 ,那么 说 系 
统 处 于 死 锁 状态 。 更 确切 地 ,存在 一 个 等 待 事务 集 {T0,T1,T2,…,Tn) ,事务 T0 正在 等 
待 被 T1 锁 住 的 数据 项 ,Tl 正在 等 待 被 T2 锁 住 的 数据 项 ,…… ,并 且 Tn 正 等 待 被 T0 锁 
住 的 数据 项 。 在 这 种 情况 下 ,没有 一 个 事务 能 取得 进展 。 
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出 现 死 锁 ,系统 的 补救 措施 是 采取 激烈 的 动作 ,如 回 滚 某 些 死 锁 的 事务 。 一 般 系 统 选 
择 撤销 代价 最 小 的 事务 回 滚 。 
数据 库 系统 中 处 理 死 锁 的 方法 主要 有 两 种 : 死 锁 预防 和 死 锁 检测 与 恢复 。 


1. 死 锁 预 防 


死 锁 预防 (deadlock prevention) 协 议 保证 系统 不 进入 死 锁 状 态 。 如 果 系 统 进 入 死 锁 状 
态 的 概率 相对 较 高 , 则 通常 使 用 死 锁 预防 机 制 。 在 数据 库 中 ,产生 死 锁 的 原因 是 两 个 或 多 个 
事务 都 封锁 了 一 些 数 据 对 象 ,然后 又 都 请 求 对 其 他 事务 封锁 的 数据 对 象 加 锁 ,从 而 出 现 死 锁 
等 待 。 死 锁 预防 的 发 生 其 实 就 是 要 破坏 产生 死 锁 的 条 件 。 预 防 死 锁 通常 有 下 列 儿 种 方法 。 

1) 一 次 封锁 法 

要 求 每 个 事务 必须 一 次 将 所 有 要 使 用 的 数据 全 部 加 锁 , 否 则 就 不 能 继续 执行 。 

一 次 封锁 法 存在 的 问题 : 一 次 性 将 以 后 要 用 到 的 全 部 数据 加 锁 , 势 必 扩 大 封锁 的 范 
围 , 从 而 降低 系统 的 并 发 度 ; 数 据 库 中 的 数据 是 不 断 变化 的 ,原来 不 要 求 封锁 的 数据 ,在 执 
行 过 程 中 可 能 会 变 成 封锁 对 象 ,所 以 很 难事 先 精确 地 确定 每 个 事务 所 要 封锁 的 数据 对 象 ， 
为 此 只 能 扩大 封锁 范围 ,将 事务 在 执行 过 程 中 可 能 要 封锁 的 数据 对 象 全 部 加 锁 , 这 就 进 一 
步 降 低 了 并 发 度 。 

2) 顺序 封锁 法 

顺序 封锁 法 是 预先 对 数据 对 象 规定 一 个 封锁 顺序 ,所 有 事务 都 按 这 个 顺序 实行 封锁 。 
例如 ,在 B+ 树 结构 的 索引 中 ,可 以 规定 封锁 的 顺序 必须 从 根 结 点 开始 ,然后 是 下 一 级 的 
子 结 点 , 逐 级 封锁 。 

















2， 死 锁 检测 与 恢复 


如 果 数 据 库 管 理 系 统 不 采用 死 锁 预 防 协议 ,那么 系统 必须 采用 死 锁 检测 与 恢复 
(deadlock detection and recovery) 机 制 。 死 锁 检 测 与 恢复 机 制 下 ,检查 系统 死 锁 状态 的 
算法 周期 性 激活 ,判断 有 无 死 锁 发 生 ,如 果 发 生死 锁 , 将 系统 从 死 锁 中 恢复 。 系 统 为 了 判 
断 死 锁 的 发 生 ,必须 实时 收集 、 维 护 当 前 将 数据 项 分 配给 事务 的 有 关 信息 ,以 及 任何 尚未 
解决 的 数据 项 请 求 信息 。 

1) 死 锁 检测 (deadlock detection) 

诊断 死 锁 的 方法 与 操作 系统 类 似 , 一 般 使 用 超时 法 或 等 待 图 法 。 

(1) 超时 法 。 

如 果 一 个 事务 的 等 待 时 间 超 过 了 规定 的 时 限 ,就 认为 其 发 生 了 死 锁 。 

超时 法 实现 简单 ,缺点 也 很 明显 ,一 般 很 难 确定 一 个 事务 超时 之 前 应 等 待 多 长 时 间 。 
如 果 已 经 发 生死 锁 , 等 待 时 间 太 长 就 会 导致 死 锁 发 生 后 不 能 及 时 发 现 。 如 果 等 待 时 间 太 
短 , 即 便 没有 死 锁 ,也 可 能 误 判 引起 事务 回 滚 。 

(2) 等 待 图 (wait-for graph) 法 。 

用 事务 等 待 图 动态 反映 所 有 事务 的 等 待 情况 。 事 务 等 待 图 是 一 个 有 向 图 G= (T， 
U),T 为 结 点 的 集合 ,每 个 结 点 表示 正 运 行 的 事务 ;U 为 边 的 集合 ,每 条 边 表示 事务 等 待 
的 情况 。 若 Tl 等待 T2, 则 T1、T2 之 间 划 一 条 有 向 边 , 从 Tl 指向 T2。 事 务 等 待 图 动态 
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反映 了 所 有 事务 的 等 待 情 况 。 并 发 控制 子 系统 周期 性 地 检测 事务 等 待 图 ,如 果 发 现 图 中 
存在 回路 , 则 表示 系统 中 出 现 了 死 锁 。 

2) 死 锁 恢 复 (deadlock recovery) 

数据 库 管理 系统 的 并 发 控制 子 系统 一 旦 检测 到 系统 中 存在 死 锁 ,就 要 设法 解除 ,将 系 
统 从 死 锁 状 态 中 恢复 过 来 。 通 常 的 做 法 是 选择 一 个 处 理 死 锁 代 价 最 小 的 事务 , 即 牺牲 事 
务 , 将 其 撤销 ,释放 此 事务 持 有 的 所 有 的 锁 , 使 其 他 事务 能 继续 运行 下 去 。 当 然 , 对 选中 撤 
销 的 事务 执行 的 数据 修改 操作 必须 加 以 恢复 。 





12.5 多 粒度 封锁 


X 锁 和 S 锁 都 是 加 在 某 一 个 数据 对 象 上 的 。 封 锁 的 对 象 可 以 是 逻辑 单元 ,也 可 以 是 
物理 单元 。 例 如 ,在 关系 数据 库 中 ,封锁 对 象 可 以 是 属性 、 元 组 ,关系 、 数 据 库 等 逻辑 单元 ， 
也 可 以 是 数据 页 索引 页 、 块 等 物理 单元 。 封 锁 对 象 可 以 很 大 ,如 对 整个 数据 库 加 锁 , 也 可 
以 很 小 ,如 对 某 个 属性 项 加 锁 。 

封锁 对 象 的 大 小 称 为 封锁 的 粒度 (granularity) 。 

封锁 粒度 与 系统 的 并 发 度 和 并 发 控制 的 开销 密切 相关 。 封 锁 粒 度 越 大 ,系统 中 能 被 
封锁 的 对 象 就 越 少 ,并 发 度 也 就 越 小 ,但 同时 系统 的 开销 也 就 越 小 ;反之 ,粒度 越 小 ,并 发 
度 越 高 ,系统 开销 也 就 越 大 。 

系统 应 该 根据 需要 选择 不 同 粒度 的 封锁 对 象 , 使 得 系统 开销 与 并 发 之 间 得 到 最 优 。 

一 般 地 ,需要 处 理 大 量 元 组 的 用 户 事务 可 以 以 关系 为 封锁 粒度 ;而 对 于 一 个 处 理 少量 
元 组 的 用 户 事务 , 则 应 以 元 组 为 封锁 粒度 ,以 提高 并 发 度 。 

不 同 粒度 的 数据 对 象 之 间 的 包含 或 属于 用 图 形 化 的 方式 表达 就 是 多 粒度 树 。 实 际 的 
并 发 控制 是 一 种 多 粒度 并 发 控制 。 














12.5.1 多 粒度 树 


多 粒度 树 的 根 结 点 是 整个 数据 库 ,表示 最 大 的 数据 粒度 , 叶 结 点 表示 最 小 的 数据 粒度 。 
图 12. 5 给 出 了 一 个 三 级 多 粒度 树 。 根 结 点 为 数据 库 , 中 间 结 点 为 关系 ,关系 的 子 结 
点 为 元 组 。 








CE - 六 站 ”站 站 -六 站 


12.5 三 级 多 粒度 树 
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对 一 个 结 点 加 锁 意味 着 这 个 结 点 的 所 有 后 背 结 点 也 被 加 以 同样 类 型 的 锁 。 因 此 ,多 
粒度 封锁 中 一 个 数据 对 象 可 能 以 两 种 方式 封锁 , 即 显 式 封锁 和 隐 式 封锁 。 

显 式 封锁 是 事务 直接 加 到 数据 对 象 上 的 锁 ; 隐 式 封锁 是 该 数据 对 象 没有 被 事务 独立 
加 锁 , 但 由 于 其 上 级 结 点 加 锁 而 使 得 该 数据 对 象 加 上 了 锁 。 一 般 地 ,对 某 个 数据 对 象 加 
锁 ,系统 要 检查 该 数据 对 象 上 有 无 显 式 封锁 与 之 冲突 ;再 检查 其 所 有 上 级 结 点 ,看 本 事务 
的 显 式 封锁 是 否 与 该 数据 对 象 上 的 隐 式 封锁 冲突 ;还 要 检查 其 所 有 下 级 结 点 ,看 下 级 结 点 
的 显 式 封锁 是 否 与 本 事务 的 隐 式 封锁 (将 加 到 下 级 结 点 的 封锁 ) 冲 突 。 这 样 的 检查 方法 效 
率 很 低 。 

为 了 提高 多 粒度 封锁 机 制 下 加 锁 的 检查 效率 ,引入 一 种 新 型 锁 一 一 意向 锁 (Intention 
lock)。 有 了 意向 锁 ,系统 无 须 逐 个 检查 下 一 级 结 点 的 显 式 封锁 。 


12.5.2 意向 锁 


意向 锁 的 含义 是 : 对 任 一 结 点 加 基本 锁 ,必须 先 对 它 的 上 层 结 点 加 意向 锁 ; 如 果 对 一 
个 结 点 加 意向 锁 , 则 说 明 该 结 点 的 下 层 结 点 正在 被 加 锁 。 

例如 ,对 任 一 元 组 1 加 锁 , 先 对 关系 R 加 意向 锁 。 

又 如 ,事务 工 对 关系 人 加 X 锁 ,系统 只 要 检查 根 结 点 数据 库 和 关系 R 是 否 已 加 了 不 
相 容 的 锁 即 可 ,不 需要 搜索 和 检查 R 中 的 每 个 元 组 是 否 加 了 X 锁 。 

意向 锁 分 为 意向 共享 锁 (Intent Share Lock,IS 锁 ) ,意向 排他 锁 (Intent Exclusive 
Lock, IX 锁 ) 和 共享 意向 排他 锁 (Share Intent Exclusive Lock,SIX 锁 ) 3 种 。 


1. 1S 锁 


对 一 个 数据 对 象 加 IS 锁 , 表 示 它 的 后 裔 结 点 拟 (意向 ) 加 S 锁 。 
例如 ,对 某 个 元 组 加 S 锁 ,首先 要 对 关系 和 数据 库 加 IS 锁 。 


2. IX 锁 


对 一 个 数据 对 象 加 IX 锁 , 表 示 它 的 后 裔 结 点 拟 (意向 ) 加 X 锁 。 
例如 ,对 某 个 元 组 加 X 锁 ,首先 要 对 关系 和 数据 库 加 IX 锁 。 


3. SIX 锁 


对 一 个 数据 对 象 加 SIX 锁 ,表示 对 它 先 加 S 锁 ,再 加 芒 锁 , 即 SIX=S+IX。 

例如 ,对 某 个 表 加 SIX 锁 , 表 示 该 事务 要 读 整 个 表 , 所 以 要 对 该 表 加 S 锁 ,同时 会 更 
新 个 别 元 组 ,所 以 要 对 该 表 加 IX 锁 。 

加 入 意向 锁 后 , 锁 的 相 容 矩阵 如 图 12. 6 所 示 。 

这 5 种 锁 的 强度 偏 序 关 系 如 图 12. 7 所 示 。 锁 强度 指 某 种 锁 对 其 他 锁 的 排斥 程度 。 
一 个 事务 在 申请 封锁 时 以 强 锁 代替 弱 锁 是 安全 的 ,反之 则 不 然 。 
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图 12.6 锁 的 相 容 矩阵 图 12.7 锁 的 强度 偏 序 关系 


在 具有 意向 锁 的 多 粒度 封锁 方法 中 ,任意 事务 T 要 对 一 个 数据 对 象 加 锁 , 必须 先 对 
其 上 级 结 点 加 意向 锁 。 申 请 封锁 时 应 该 按照 自 上 而 下 的 次 序 进行 ,释放 封锁 时 则 应 该 按 
自 下 而 上 的 次 序 进行 。 例 如 ,事务 要 对 关系 R 加 S 锁 , 则 首先 要 对 数据 库 加 IS 锁 。 检 
查 数据 库 和 R 是 否 已 经 加 了 不 相 容 的 锁 一 一 X 或 I[X 锁 , 不 再 需要 检查 R 中 的 每 个 元 组 
是 否 加 了 不 相 容 的 锁 一 一 X 锁 。 

具有 意向 锁 的 多 粒度 封锁 方法 提高 了 系统 并 发 度 ,减少 了 加 锁 和 解锁 的 开销 ,实际 的 
数据 库 管理 系统 产品 得 到 了 广泛 的 应 用 。 


12.6 小 结 


数据 库 系 统 中 的 数据 是 由 数据 库 管 理 系统 统一 管理 和 控制 的 ,数据 库 管 理 系 统 必须 
提供 并 发 控制 ,以 保证 数据 库 中 的 数据 安全 可 靠 、 正 确 有 效 。 

并 发 控制 与 数据 库 恢 复 的 基本 单位 都 是 事务 (transaction) 。 事 务 是 用 户 定义 的 构成 
单一 多 辑 工 作 单元 的 数据 库 操作 集合 。 事 务 具 有 4 个 特性 : 原子 性 (Atomicity) 一致 性 
(Consistency)、 隅 离 性 (Isolation) 和 持续 性 (Durability) , 合 称 为 ACID 特性 。 

为 提高 吞吐 量 .资源 利用 率 以 及 减少 等 待 时 间 ,DBMS 事务 处 理 系统 通常 允许 多 个 
事务 并 发 执行 。 

并 发 操作 会 带 来 丢失 更 新 、 读 脏 数据 和 不 可 重复 读 3 类 问题 。 

并 发 事务 调度 要 保证 数据 一 致 性 ,并 行 调度 必须 是 可 串 行 化 的 。 

封锁 就 是 事务 在 对 某 个 数据 对 象 操作 之 前 , 先 向 系统 发 出 请 求 , 对 其 加 锁 。 加 锁 后 事 
务 就 对 该 数据 对 象 有 了 一 定 的 控制 ,确切 的 控制 由 封锁 的 类 型 决定 。 在 事务 释放 它 的 锁 
之 前 ,其 他 事务 不 能 更 新 此 数据 对 象 。 基 本 的 封锁 类 型 有 排他 锁 (Exclusive Locks,X 锁 ) 
和 共享 锁 (Share Locks,S 锁 ) 两 种 。 

对 数据 对 象 加 锁 时 ,需要 约定 一 些 规则 , 何 时 申请 X 锁 或 S 锁 、 持 锁 时 间 、 何 时 释放 
等 , 称 为 封锁 协议 。 不 同 规则 的 封锁 协议 在 不 同 的 程度 上 为 并 发 操作 的 正确 调度 提供 了 
保证 。 第 12. 3 节 讨 论 了 常用 的 三 级 封锁 协议 和 保证 并 发 控制 可 串 行 化 的 两 段 锁 协 议 。 

对 数据 对 象 进行 加 锁 控制 带 来 了 新 的 问题 , 即 死 锁 。 

封锁 对 象 的 大 小 称 为 封锁 的 粒度 (granularity) 。 实 际 的 并 发 控制 是 一 种 多 粒度 并 发 
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控制 。 

封锁 粒度 与 系统 的 并 发 度 和 并 发 控制 的 开销 密切 相关 。DBMS 应 该 根据 事务 读 写 
需要 选择 不 同 粒度 ,使 得 系统 开销 与 并 发 度 之 间 最 优 。 

为 了 提高 多 粒度 封锁 机 制 下 加 锁 的 检查 效率 ,引入 意向 锁 (intention lock)。 有 了 意 
向 锁 ,系统 无 须 逐 个 检查 当前 加 锁 结 点 下 级 结 点 的 显 式 封锁 。 意 向 锁 分 为 意向 共享 锁 ( 即 
IS 锁 ) ,意向 排他 锁 ( 即 IX 锁 ) 和 共享 意向 排他 锁 ( 即 SIX 锁 ) 3 种 。 


12.7 习题 


. 什么 是 事务 的 ACID 性 质 ? 

. 并 发 操作 可 能 带 来 的 问题 有 哪些 ? 

. 什么 是 封锁 ?封锁 类 型 有 哪些 ? 分 别 是 什么 含义 ? 
. 什么 是 三 级 封锁 协议 ? 

. 什么 样 的 并 发 调度 是 正确 的 调度 ? 

. 简 述 引入 意向 锁 的 意义 。 


Dan 性 
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第 13 章 数据库 存储 技术 
本 章 讨论 数据 库 系 统 内 模式 描述 中 的 记录 数据 文件 与 索引 组 织 及 存 取 技 术 。 


13.1 数据 库 系统 存储 结构 


内 模式 是 数据 库 系统 中 数据 结构 和 存储 方式 的 描述 ,是 数据 在 系统 内 部 的 组 织 方式 。 
它 定义 所 有 内 部 记录 文件 .索引 的 组 织 方式 以 及 数据 存 取 细 节 。 


13.1.1 数据 库 磁 盘存 储 器 中 的 数据 结构 


1. 数据 文件 


数据 文件 (data file) 存 储 数据 本 身 。 在 存储 结构 上 ,数据 库 中 的 数据 以 文件 形式 存储 
在 磁盘 上 ,以 便利 用 操作 系统 文件 的 调度 功能 。 


2. 日 志文 件 


日 志 按时 间 顺 序 存储 数据 库 系统 运行 过 程 中 对 数据 的 各 种 更 新 操作 。 建 立 日 志 的 目 
的 是 为 数据 库 恢复 以 及 统计 数据 库 使 用 情况 所 用 。 日 志文 件 (log file) 需 要 登记 的 内 容 主 
要 有 : 每 个 事务 的 事务 标识 开始、 结束 ,事务 操作 数据 更 新 前 、 后 的 值 ,事务 操作 的 用 户 
标识 等 。 


3. 数据 字典 


数据 字典 (Data Dictionary,DD) 是 关于 数据 库 中 数据 的 描述 , 即 元 数据 (metadata)。 
数据 字典 是 数据 库 管理 系统 内 部 的 一 组 系统 表 , 记 录 了 数据 库 中 所 有 的 定义 信息 ,包括 各 
级 模式 定义 、 完 整 性 ,安全 性 定义 ,统计 信 息 等 。 数 据 字 典 通 常 包括 数据 项 、 数 据 结构 , 数 
据 流 、 数 据 存储 和 处 理 过 程 5 部 分 。 


4. 索引 文件 


索引 是 为 提高 查找 速度 而 建立 的 逻辑 排序 映射 。 利 用 索引 属性 值 与 对 应 的 表 记 录 之 
间 的 映射 关系 表 , 可 以 很 快 定位 具有 索引 值 的 记录 在 数据 表 中 的 位 置 ,提高 查找 效率 。 常 
见 的 索引 文件 (index file) 包 括 主 索 引文 件 .B+ 树 索引 文件 . 散 列 (hash) 索 引文 件 等 。 


5. 统计 信息 
统计 信息 (database statistics) 存 储 数据 库 系统 运行 时 统计 分 析 的 数据 ,存储 在 数据 
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字典 中 。 基 于 代价 的 查询 优化 要 计算 各 种 操作 算法 的 执行 代价 ,需要 存储 并 利用 这 些 统 
计 信 息 。 统 计 信 息 是 动态 变化 的 。 


13.1.2 数据 库 系统 存储 介质 


数据 库 系统 中 存在 多 种 数据 存储 类 型 ,具体 分 成 如 下 几 类 。 
1. 高 速 缓冲 存储 器 


高 速 缓冲 存储 器 简称 为 “高速 缓 存 ”", 也 就 是 Cache。 数 据 库 系统 不 研究 高 速 缓存 存 
储 器 的 存储 管理 。 但 在 设计 查询 处 理 时 ,数据 库 实现 者 会 考虑 高 速 缓存 存储 器 的 影响 。 


2. 主 存储 器 


主 存储 器 (main memory) 也 称 为 “ 主 存 ”, 用 于 存放 系统 正在 处 理 的 数据 。 操 作 系 统 
可 以 直接 对 内 存 中 的 数据 进行 修改 。 如 果 发 生 电源 故障 或 者 系统 崩 淡 , 主 存 储 器 中 的 内 
容 通 常会 丢失 。 


3. 快 擦 写 存储 器 


快 擦 写 存储 器 (flash memory) 又 称 为 “ 电 可 擦 可 编程 只 读 存储 器 ”( 即 EEPROM) , 简 
称 为 “ 快 闪存 ”。 快 闪存 掉 电 后 数据 可 以 保存 下 来 。USB 盘 已 经 成 为 数据 传输 主流 手段 
之 一 


4. 磁盘 存储 器 


磁盘 存储 器 (magnetic-disk storage) 是 一 种 大 容量 的 、 可 直接 存 取 的 外 部 存储 设备 。 
磁盘 有 软磁盘 和 硬 磁盘 之 分 。 现 在 的 磁盘 均 指 硬 磁盘 。 通 常 整个 数据 库 都 存储 在 磁盘 
上 ,磁盘 容量 大 约 每 年 以 50% 的 速度 增长 。 磁 盘存 储 器 不 会 因为 系统 故障 而 丢失 数据 。 


5. 磁盘 郊 余 阵列 


简单 来 说 ,磁盘 元 余 阵 列 (Redundant Arrays of Independent Disk,RAID) 通 过 宛 余 
改善 可 靠 性 ,通过 并 行 提高 数据 传输 速率 。 

最 简单 的 宛 余 方法 是 复式 存储 RAID0。 由 于 磁盘 可 以 并 行 存 取 ,RAID 可 以 把 数据 
拆 分 存放 在 多 个 磁盘 上 ,并 行 存 取 它们 ,以 提高 RAID 的 数据 传输 速率 。 


6. 光 存 储 器 


光 存 储 器 (optical storage) 利 用 光学 原理 ,借助 激光 器 读 取 光 盘 上 的 数据 。 与 光盘 驱 
动 器 的 成 本 对 比 , 快 闪存 存储 器 、 云 存储 技术 更 划算 。 


7. 磁带 存储 器 
磁带 存储 器 (tape storage) 用 于 存储 备份 数据 .归档 数据 ,不 经 常 使 用 的 数据 ,以 及 作 
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为 将 数据 系统 转移 的 脱 机 介质 。 存 储 设备 中 ,磁带 最 便宜 ,但 其 访问 速度 较 慢 。 对 于 大 规 
模 的 应 用 , 相 较 磁带 备份 ,备份 数据 到 磁盘 驱动 器 已 经 成 为 一 种 更 划算 的 选择 。 














13.2 数据 文件 的 记录 格式 


一 般 地 ,数据 文件 的 记录 有 两 种 方式 : 定 长 记录 与 变 长 记录 。 
13.2.1 定 长 记录 


例如 ,对 于 关系 模式 employee(ENO,ENAME,SALARY) ,设计 一 个 数据 文件 ,记录 
格式 定义 如 下 : 


TYPE employee= RECORD 
ENO:CHAR (5)7 
ENAME :CHAR (15) 7 
SALARY :NUMERIC (8,2); 
END 


假设 每 个 字符 占 1B,NUMERIC(8,2) 占 8B, 每 个 记录 占 28B。 定 长 记录 格式 最 简单 
的 组 织 方式 是 物理 顺序 存储 。 

除非 磁盘 块 的 大 小 恰好 是 28 的 整数 倍 , 否 则 一 些 记 录 会 横 跨 两 个 块 。 读 写 这 样 的 记 
录 时 就 要 访问 两 个 块 。 

1. 删除 操作 时 的 考虑 

删除 一 个 记录 ,可 采用 下 面 3 种 方法 之 一 来 实现 。 

(1) 被 删 记 录 后 的 记录 一 次 移 上 来 ,删除 一 个 记录 平均 要 移动 文件 中 的 一 半 记 录 。 

(2) 文件 中 最 后 一 个 记录 填补 到 被 删 记录 位 置 。 

(3) 被 删 结 点 用 指针 链接 起 来 。 


在 每 个 记录 中 增加 一 个 指针 ,在 文件 中 增设 一 个 文件 首部 。 删 除 记 录 后 的 被 删 记录 
链 结构 如 图 13. 1 所 示 。 


2. 插入 操作 时 的 考虑 

如 果 采 用 把 被 删 记录 链 接 起 来 的 方法 ,那么 插入 操作 可 采用 下 列 方法 : 在 空闲 记录 
链表 的 第 一 个 空闲 记录 中 填 上 插入 记录 的 值 ,同时 使 首部 指针 指向 下 一 个 空闲 记录 ;如 果 
空闲 记录 链表 为 空 , 则 新 记录 插 到 文件 尾 。 
13.2.2 变 长 记录 


在 数据 库 系统 中 ,更 多 的 时 候 文件 中 的 记录 是 变 长 格式 。 
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文件 首部 一 
记录 0 10101 SIRI 600 
记录 1 12121 CAROLINE 700 
记录 2 一 - 
记录 3 22222 KARL 600 | 
记录 4 
记录 5 33456 ROSE 800 
记录 6 一 一 
记录 7 58583 KIM 600 一 
记录 8 76543 JACK 400 

















图 13.1 删除 记录 后 的 被 删 记录 链 结构 


1. 变 长 记录 的 表示 


一 条 有 变 长 属性 的 记录 表示 通常 分 为 两 个 部 分 : 定 长 属性 与 变 长 属性 。 记 录 的 初始 
部 分 是 定 长 属性 , 接 下 来 是 变 长 属性 。 对 于 定 长 属性 ,如 日 期 ,数值 . 定 长 字符 串 , 分 配 它 
们 所 需 的 字 节 数 。 对 于 变 长 属性 ,如 变 长 字符 串 , 在 记录 的 初始 部 分 中 表示 其 为 一 个 对 值 
( 偏 移 量 ,长 度 ) 。 


2. 变 长 记录 在 块 中 的 存储 
变 长 记录 一 般 使 用 分 槽 的 页 结构 在 磁盘 块 中 存储 ,如 图 13. 2 所 示 。 


























块头 记录 
条 目 个 数 | | 
fe … 空闲 空间 … | | | 
| 1 
< 人 
1 














| 


13.2 分 槽 式 页 结构 


在 每 块 的 开始 处 设置 一 个 “ 块 首部 ”, 其 中 包括 下 列 信息 : 块 中 记录 数目 、 指 向 块 中 自 
由 空间 尾部 的 指针 、 登 记 每 个 记录 的 开始 位 置 和 大 小 的 信息 。 

在 块 中 ,实际 记录 紧 连 着 ,并 靠近 块 尾部 连续 存放 。 持 入 总 是 从 自由 空间 尾部 开始 ， 
并 在 块 首 部 登录 其 插入 记录 的 开始 位 置 和 大 小 。 记 录 删 除 时 只 要 在 块 首部 ,该 记录 的 大 
小 登记 处 改 为 一 1 即 可 。 
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13.3 数据 文件 格式 


数据 文件 格式 即 文件 中 记录 的 组 织 。 
13.3.1 文件 格式 
文件 格式 主要 有 下 列 4 种 形式 。 


(1) 堆 文件 。 一 般 以 输入 顺序 为 序 。 

(2) 顺序 文件 。 记 录 是 按 查找 键 值 升序 或 降序 的 顺序 存储 的 。 

(3) 散 列 文 件 。 根 据 记 录 的 某 个 属性 值 通过 散 列 函数 计算 求 得 的 值 作为 记录 的 存储 
地 址 。 

(4) 聚集 文件 。 一 个 文件 可 以 存储 多 个 关系 的 记录 。 不 同 关系 中 有 联系 的 记录 存储 
在 同一 块 内 ,可 以 提高 查找 速度 和 I/O 速度 。 

本 节 介绍 顺序 文件 和 聚集 文件 , 散 列 索引 文件 在 13. 6 节 中 介绍 。 


13.3.2 顺序 文件 


顺序 文件 是 为 了 提高 处 理 速度 ,按照 某 个 查找 键 的 顺序 将 记录 排序 的 文件 。 查 找 键 
是 任何 一 个 属性 或 者 属性 集合 。 虽 然 很 多 时 候 查 找 键 就 是 主 码 ,但 它 并 非 一 定 是 主 码 。 
employee 表 记 录 组 成 的 顺序 文件 如 图 13. 3 所 示 ,记录 按照 ENO 值 升序 排列 。 顺 序 文件 
可 以 很 方便 地 按 查 找 键 的 值 顺序 读 出 所 有 记录 。 







































































10101 SIRI 600 
12121 CAROLINE 700 = 
15151 JOE 800 本 
22222 KARL 600 pe 
32343 ALICE 750 -一 
33456 ROSE 800 一 — 
45565 REBECCA 850 本 一 
58583 KIM 600 = 
76543 JACK 400 一 





13. 3 employee 表 记 录 组 成 的 顺序 文件 


1. 删除 操作 
删除 操作 可 以 通过 修改 指针 实现 ,被 删 记录 链接 成 一 个 自由 空间 ,以 便 插 入 时 使 用 。 
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2. 插入 操作 


插入 操作 包括 定位 和 插入 两 步 。 

(1) 定位 : 在 指针 链 中 找到 插入 的 位 置 。 

(2) 插入 : 在 找到 记录 的 块 内 ,如 果 有 空闲 记录 ,那么 在 该 位 置 插入 新 记录 ,并 加 入 
到 指针 链 中 ;如 果 无 空闲 记录 ,那么 就 只 能 插入 到 溢出 块 中 。 

随 着 时 间 的 推移 ,记录 的 逻辑 顺序 与 物理 顺序 会 越 来 越 不 一 致 ,此 时 应 该 重组 顺序 
交 件 ; 


13.3.3 聚集 文件 
大 型 数据 库 系统 在 一 个 大 的 操作 系统 文件 中 存储 多 个 甚至 所 有 关系 , 称 为 “聚集 文件 ”。 


13.4 索引 技术 


13.4.1 索引 的 概念 


当 关 系 中 的 元 组 数目 很 大 ,而 查询 只 涉及 少量 元 组 时 ,查找 速度 就 会 明显 下 降 。 这 时 
为 了 提高 查找 速度 ,对 文件 建立 索引 。 

在 数据 库 系统 中 建立 索引 的 基本 原理 与 图 书馆 的 藏书 索引 类 似 。 对 于 经 常 需要 查找 
的 条 件 ,建立 起 查找 条 件 ( 即 索引 查找 键 与 元 组 记录 的 映射 关系 ) ,利用 索引 找到 含有 某 个 
有 具体 的 查找 键 值 的 元 组 记录 在 文件 中 的 位 置 比 从 头 扫描 数据 文件 高 效 得 多 。 

本 节 讨 论 基本 的 主 索引 及 其 实现 ,13.6 节 将 讨论 散 列 索引 技术 。 

在 索引 中 ,用 于 查找 记录 的 属性 集 称 为 查找 键 。 索 引 结构 由 两 部 分 组 成 : 索引 和 被 
索引 数据 文件 。 相 较 被 索引 文件 ,索引 空间 小 ,因而 查找 速度 快 。 

如 果 被 索引 文件 按照 某 个 查找 键 指定 的 顺序 排序 存放 记录 ,这 个 查找 键 对 应 的 索引 
称 为 聚集 索引 (clustering index) 。 查 找 键 指定 的 逻辑 顺序 与 被 索引 文件 中 记录 的 物理 次 
序 不 同 的 索引 称 为 非 聚 集 索 引 (nonclustering index) 或 辅助 索引 。 


13.4.2 主 索引 


在 13.3. 2 节 中 ,假定 被 索引 文件 按照 某 个 查找 键 顺序 排列 记录 ,在 这 个 查找 键 上 对 
应 的 聚集 索引 称 为 索引 顺序 文件 ,简称 主 索引 。 索 引 顺 序 文件 是 数据 库 系统 最 早 采用 的 
索引 模式 。 

图 13. 3 就 是 一 个 以 职员 号 ENO 作为 查找 键 的 顺序 文件 。 

主 索引 的 实现 方法 可 以 是 稠密 索引 、 稀 疏 索引 和 多 级 索引 3 种 。 





263 











数据 库 原理 及 应 用 


1. 稠密 索引 和 稀 疏 索引 


索引 项 或 者 索引 记录 由 一 个 查找 键 值 和 指向 具有 该 查找 键 值 的 一 条 或 者 多 条 记录 指 
针 构 成 。 

可 以 使 用 的 主 索 引 有 两 类 。 

(1) 稠密 索引 (Cdense index) : 对 顺序 文件 中 每 个 查找 键 值 建立 一 个 索引 记录 ,索引 
记录 包括 查找 键 值 和 指向 具有 该 值 的 记录 链表 中 第 一 个 记录 的 指针 。 这 种 索引 称 为 “ 笛 
密 索 引 ?。 注 意 , 有 些 教材 将 稠密 索引 定义 为 对 顺序 文件 中 每 个 记录 建立 一 个 索引 记录 ， 
与 本 书 的 提 法 有 区 别 。 

(2) 稀 下 索 引 (sparse index) : 在 顺序 文件 中 ,对 若干 个 查找 键 值 才 建 立 一 个 索引 记 
录 , 此 时 索引 记录 的 内 容 仍 和 稠密 索引 一 样 。 这 种 索引 称 为 “ 稀 朴 索引 ”"。 聚 集 索引 才能 
使 用 稀疏 索引 。 

相 比 之 下 ,在 带 稠密 索引 的 顺序 文件 中 ,查找 速度 较 快 ;而 带 稀 朴 索引 的 文件 中 查找 
速度 较 慢 ,但 稀 下 索 引 的 空间 较 小 ,因此 更 新 操作 时 索引 指针 的 维护 相对 要 少 一 些 。 

系统 设计 者 应 在 存 取 时 间 和 开销 两 方面 权衡 ,选择 索引 。 有 一 个 折 中 的 办 法 ,可 把 两 
种 索引 结合 起 来 。 

首先 为 顺序 文件 的 每 一 块 建立 一 个 索引 记录 ,得 到 一 个 以 块 为 基本 单位 的 稠密 索引 ， 
然后 再 在 稠密 索引 的 基础 上 建立 一 个 稀 朴 索引 。 查 找 时 , 先 在 稀 朴 索引 中 找到 记录 所 在 
的 范围 ,然后 在 稠密 索引 中 确定 记录 在 哪 一 块 ,最 后 在 顺序 文件 的 块 中 顺序 查找 ,找到 所 
在 的 记录 。 这 种 方法 实际 已 是 二 级 索引 了 。 


2， 多 级 索引 


在 关系 数据 量 巨大 的 情况 下 ,即使 采用 稀疏 索引 ,建成 的 索引 也 会 很 大 ,以 至 于 查询 
效率 不 高 。 

如 果 索 引 较 小 ,系统 运行 时 可 以 常 驻 内 存 , 查 找 速度 还 是 较 快 的 。 但 是 ,如 果 索 引 过 
大 不 能 放 在 主 存 中 , 那 就 必须 从 磁盘 读 取 索 引 块 。 假 设 索 引 占 据 5 个 物理 块 ,采用 顺序 查 
找 , 那 么 最 多 需要 读 取 5 块 。 如 果 采 用 二 分 查找 , 则 读 的 块 数 是 [logs5 | 如 果 索 引 中 使 用 
了 溢出 块 技术 ,采用 顺序 查找 耗 时 会 更 长 。 

解决 这 个 问题 的 方法 是 像 对 待 顺序 文件 一 样 对 待 索引 文件 ,在 原始 的 内 层 索 引 上 构 
造 一 层 稀 踢 的 二 级 索引 。 具 体 地 ,对 顺序 文件 以 块 为 单位 ,建立 稠密 索引 ,再 在 稠密 索引 
的 基础 上 建立 稀疏 索引 。 有 时 这 个 二 级 外 层 索引 仍然 过 大 ,可 以 类 似 地 建立 多 级 索引 , 直 
至 最 外 层 索引 可 以 常 驻 内 存 。 

当 需 要 查找 具有 某 查找 键 值 的 记录 时 ,以 二 级 索引 为 例 ,系统 在 常 驻 内 存 的 外 层 索 引 
中 使 用 二 分 查找 ,找到 小 于 或 者 等 于 某 查找 键 值 的 最 大 索引 键 值 , 沿 着 索引 记录 指针 到 达 
内 层 索 引 块 ;在 内 层 索 引 块 中 顺序 查找 或 者 二 分 查找 ,找到 相应 的 索引 记录 ;然后 沿 着 内 
层 索 引 记录 的 指针 达到 顺序 文件 的 某 个 数据 块 :在 数据 块 中 沿 指针 链 查找 到 具有 某 查找 
键 值 的 记录 。 多 级 索引 的 查找 与 二 级 索引 的 查找 类 似 , 这 里 不 再 袭 述 。 

多 级 索引 和 树 结构 紧密 相关 , 常 使 用 B+ 树 或 者 B 树 形 式 实现 ,类 似 于 内 存 索引 的 二 
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叉 树 。 第 13. 5 节 中 将 讨论 这 种 树 形 结构 。 
13.4.3 辅助 索引 


在 主 索引 中 ,人 们 可 以 方便 ,快速 地 根据 查找 键 值 找 记 录 。 如 果 要 根据 男 一 个 查找 键 
值 寻找 顺序 文件 的 记录 ,那么 可 以 用 辅助 索引 方法 来 实现 。 

在 辅助 索引 中 ,具有 相同 查找 键 值 的 记录 将 分 散在 文件 的 各 处 ,无 法 利用 顺序 文件 中 
按 主 索引 键 值 建立 的 指针 链 , 因 而 查找 速度 较 慢 。 辅 助 索 引 必须 是 稠密 索引 。 

辅助 索引 可 采用 下 面 的 方法 来 实现 : 仍然 为 每 个 查找 键 值 建立 一 个 索引 记录 ,内 容 
包括 查找 键 值 和 一 个 指针 。 指 针 不 指向 顺序 文件 记录 ,而 是 指向 一 个 指针 列表 一 一 桶 
(bucket) , 桶 内 存放 指向 具有 同一 查找 键 值 的 记录 指针 。 例 如 ,在 图 13. 3 的 顺序 文件 中 ， 
可 以 对 属性 SALARY 建立 一 个 辅助 索引 ,其 结构 如 图 13.4 所 示 。 













































































10101 SIRI 600 | 

400 12121 CAROLINE 700 = == 
60 | 二 一 15151 JOE 800 = 
700 | Te | 22222 KARL 600 _ 上 -一 
750 | 32343 ALICE 750 Es= 
800 | ~ 33456 ROSE 800 上 -一 
s50 | | 45565 | REBECCA | 850 _ 上 一 
ANN 58583 KIM 600 上 一 

76543 JACK 400 了 


13.4 employee 文件 辅助 索引 


在 辅助 索引 中 ,同一 个 查找 键 值 的 记录 分 散在 文件 的 各 处 ,因此 ,以 辅助 索引 查找 键 
顺序 扫描 文件 是 行 不 通 的 ,每 读 一 个 记录 几乎 都 要 执行 读 块 到 内 存 的 操作 。 

辅助 索引 都 是 稠密 索引 ,不 可 能 是 稀疏 索引 结构 。 插 入 或 删除 文件 记录 时 ,都 要 修改 
辅助 索引 。 

辅助 索引 机 制 曾 在 20 世纪 60 年 代 中 期 广泛 流行 , 倒 排 文 件 系统 就 是 辅助 索引 文件 


13.4.4 索引 的 更 新 


在 索引 文件 中 ,文件 记录 的 插入 或 删除 有 可 能 引起 索引 的 修改 。 
1. 删除 操作 


(1) 为 了 在 顺序 文件 中 删除 一 个 记录 ,首先 要 找到 被 删 记录 ,然后 才能 执行 删除 
操作 。 
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(2) 对 于 稠密 索引 : 如 果 被 删除 的 记录 是 具有 这 个 查找 键 值 的 唯一 一 条 记录 , 则 系 
统 从 索引 中 删除 该 索引 项 ,否则 系统 就 从 指针 列表 中 删除 指向 被 删除 记录 的 索引 指针 。 

(3) 对 于 稀 疏 索引 : 如 果 索 引 不 包含 被 删除 记录 查找 键 值 的 索引 项 , 则 索引 不 需要 
修改 ,否则 用 下 一 个 查找 键 值 的 索引 记录 替换 要 删除 的 索引 记录 。 如 果 下 一 个 查找 键 值 
已 经 对 应 有 索引 项 了 , 则 直接 删除 ,而 不 是 蔡 换 。 


2. 插入 操作 


(1) 首先 用 插入 记录 的 查找 键 值 找到 插入 位 置 。 

(2) 对 于 稠密 索引 : 如 果 查 找 键 值 在 索引 块 中 未 出 现 过 , 则 要 把 插入 记录 的 查找 键 
值 插入 到 索引 块 中 ,和 否则 系统 就 在 索引 项 中 增加 一 个 指向 新 记录 的 索引 指针 或 将 新 记录 
放 到 具有 相同 查找 键 值 的 其 他 记录 之 后 。 

(3) 对 于 稀疏 索引 : 每 个 数据 块 对 应 一 个 索引 记录 ,那么 在 数据 块 能 放 得 下 新 记录 
时 ,不 必修 改 索引 。 如 果 要 加 入 新 的 数据 块 ,那么 插入 记录 的 查找 键 值 将 成 为 新 数据 块 的 
第 一 个 查找 键 值 , 并 将 在 索引 块 中 插入 一 个 新 的 索引 记录 。 

在 多 级 索引 时 ,可 以 采取 类 似 的 办 法 。 


13.5 B+ 树 索 引文 件 


实际 的 数据 库 系 统 为 了 改善 索引 性 能 ,通常 采用 多 级 索引 技术 。 目 前 ,多 级 索引 技术 
中 广泛 流行 的 是 平衡 树 (balanced tree) 技 术 。 

数据 库 技术 中 平衡 树 的 定义 如 下 所 述 。 

定义 13.1 一 棵 xm 阶 平衡 树 或 者 为 空 , 或 者 满足 以 下 条 件 : 

每 个 结 点 至 多 有 m 棵 子 树 ; 

根 结 点 或 为 叶 结 点 ,或 至 少 有 两 棵 子 树 ; 

每 个 非 叶 结 点 至 少 有 [m/2 桌子 树 ; 

从 根 结 点 到 叶 结 点 的 每 条 路 径 都 有 同样 的 长 度 , 即 叶 结 点 在 同一 层次 上 。 

平衡 树 又 分 为 两 类 : B+ 树 和 B 树 。 本 书 介绍 B+ 树 。 


13.5.1 B 十 树 的 结构 


B+ 树 索 引 结 构 是 使 用 最 广泛 的 索引 结构 之 一 。 平衡 的 意思 是 指 树 根 到 树叶 的 每 条 
路 径 的 长 度 相同 ,平衡 属性 保证 B+ 树 具有 良好 的 查找 .插入 和 修改 性 能 。 

典型 的 m 阶 B+ 树 按 下 列 方式 组 织 。 

(1) 每 个 结 点 中 至 多 有 m 一 1 个 查找 键 值 Ki ,K;,…,K。-1,m 个 指针 P,P;,…， 
PP ,如 图 13.5 所 示 。 





| Bp | Ki P, 加 有 Ka Pu 





图 13.5 B+ 树 的 结 点 
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(2) 叶 结 点 的 组 织 方式 。 

叶 结 点 中 的 指针 (1 二 i<m 一 1) 指 向 顺序 文件 中 的 记录 。 例 如 ,指针 P; 指向 查找 键 
值 为 K; 的 记录 。 

如 果 查 找 键 恰好 是 顺序 文件 的 主键 ,那么 叶 结 点 中 的 指针 直接 指向 顺序 文件 中 的 记 
录 。 如 果 查 找 键 不 是 顺序 文件 的 主键 ,那么 叶 结 点 中 的 指针 指向 一 个 桶 , 桶 中 存放 指向 具 
有 该 查找 键 值 的 记录 的 指针 。 

每 个 叶 结 点 中 至 少 应 有 [(m 一 1)/2 惟 查 找 键 ,至 多 有 m 一 1 个 查找 键 ,并 且 查 找 键 值 
不 允许 重复 。 如 果 B+ 树 索引 是 稠密 索引 ,那么 每 个 查找 键 值 必须 在 某 个 叶 结 点 中 出 现 。 
叶 结 点 中 最 后 一 个 指针 Pu 指向 下 一 个 叶 结 点 ( 按 查 找 键 值 顺序 ) ,这 样 可 以 很 方便 地 进 
行 顺序 访问 。 

(3) 非 叶 结 点 的 组 织 方式 。 

B+ 树 中 的 非 叶 结 点 形成 了 叶 结 点 上 的 一 个 多 级 稀疏 索引 。 每 个 非 叶 结 点 ( 根 结 点 除 
外 ) 中 至 少 有 [m/2 淮 指 针 , 至 多 有 m 个 指针 。 指 针 的 数目 称 为 结 点 的 “ 扇 出 (fanout) 端 
数 "。 图 13.6 是 一 个 完整 的 4 阶 B+ 树 索引 。 
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13.6 ”employee 的 4 阶 B+ 树 索引 


13.5.2 B+ 树 的 查询 


如 果 用 户 要 检索 查找 键 值 为 K 的 所 有 记录 ,那么 首先 在 根 结 点 中 找 大 于 K 的 最 小 
查找 键 值 K; ,然后 沿 着 K; 左边 的 指针 已, 到 达 第 二 层 的 结 点 。 如 果 根 结 点 中 及 个 指 
针 , 并 且 KK,-1 ,那么 就 沿 着 指针 P, 到 达 第 二 层 的 结 点 。 在 第 二 层 的 结 点 用 类 似 的 方 
法 找到 一 个 指针 ,进入 第 三 层 的 结 点 …… 一 直到 B+ 树 的 叶 结 点 ,找到 记录 。 

如 果 文 件 中 查找 键 值 有 W 个 值 ,那么 对 于 m 阶 B+ 树 而 言 ,从 根 结 点 到 叶 结 点 的 路 
径 长 度 不 超过 [logrwaW | 

【 例 13.1】 讨论 B+ 树 索引 查询 中 查询 次 数 与 文件 的 存储 块 数 的 关系 。 

如 果 在 B+ 树 索引 中 ,每 块 存储 一 个 结 点 , 则 占 4KB。 如 果 查 找 键 的 长 度 为 32B, 指 针 
仍 为 8B ,那么 每 块 大 约 可 存储 100 个 查找 键 值 和 指针 , 即 m 约 为 100。m 为 100 时 ,如 果 
文件 中 查找 键 有 100 万 个 值 ,那么 一 次 查找 须 读 索引 块 的 数目 为 [logso1000000 | 二 4。 如 
果 B+ 树 索引 的 根 结 点 常 驻 内 存 ,那么 查找 时 只 需 再 读 3 个 索引 块 即 可 。 
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13.5.3 B+ 树 的 更 新 


在 B+ 树 索引 文件 中 插入 记录 时 ,有 可 能 叶 结 点 要 分 裂 ,并 引起 上 层 结 点 的 分 裂 和 
B+ 树 层 数 的 增加 。 删 除 记 录 时 ,有 可 能 出 现 相反 的 现象 。 下 面 就 是 否 出 现 分 裂 与 合并 情 
况 分 别 讨论 。 


1. 不 引起 索引 结 点 分 裂 的 插入 操作 


首先 使 用 查找 方法 ,从 根 结 点 出 发 ,直到 在 叶 结 点 中 找到 某 个 查找 键 值 K, 。 如 果 插 
入 记录 的 查找 键 值 Ko 已 在 叶 结 点 中 出 现 ,那么 在 顺序 文件 中 插入 记录 即 可 ,不 必修 改 
索引 。 

如 果 K。 在 叶 结 点 中 不 存在 ,那么 在 叶 结 点 中 K, 之 前 插入 Ko 值 , 并 把 K, 及 其 后 的 
值 往 后 移动 ,然后 新 记录 就 插入 到 顺序 文件 中 。 


2. 不 引起 索引 结 点 合并 的 删除 操作 


首先 使 用 查找 方法 在 顺序 文件 中 找到 被 删 记录 ,然后 删除 之 。 

如 果 顺 序 文件 中 还 存在 具有 被 删 记录 查找 键 值 的 记录 , 则 不 必修 改 索引 ,和 否则 应 该 从 
叶 结 点 中 删除 该 查找 键 值 和 相应 的 指针 。 此 时 假定 叶 结 点 中 查找 键 值 的 数目 仍然 不 小 于 
[Cm—1)/2 1, 


3. 引起 索引 结 点 分 裂 的 插入 操作 


如 果 插 入 记录 时 要 在 叶 结 点 中 插入 其 查找 键 值 ,并且 叶 结 点 中 已 放 满 查找 键 值 ,那么 
此 时 叶 结 点 应 分 裂 成 两 个 。 例 如 ,在 图 13.6 的 4 阶 B+ 树 文件 中 插入 一 个 查找 键 值 为 
Lee 的 记录 ,那么 左边 第 三 个 叶 结 点 就 要 分 裂 成 两 个 结 点 ,如 图 13.7 所 示 。 


| Lee 


图 13.7 叶 结 点 分 裂 








KARL 





二- 











KIM | | 


























| Rebecca 








一 -| 一 


分 裂 时 ,mm 个 查找 键 值 分 别 放 在 两 个 结 点 中 。 一 般 地 ,前 [mm/2 从 查找 键 值 放 在 原来 
的 结 点 中 ,而 余下 的 查找 键 值 放 在 新 的 结 点 中 。 

叶 结 点 分 裂 后 ,必须 在 其 父 结 点 中 插入 新 结 点 中 的 最 小 查找 键 值 。 如 果 父 结 点 中 放 
满 了 查找 键 值 ,那么 也 要 分 裂 成 两 个 结 点 ,再 在 上 一 层 结 点 中 加 入 新 的 查找 键 值 。 有 时 根 
结 点 可 能 也 要 分 裂 , 导 致 产生 新 的 根 结 点 ,B+ 树 的 高 度 增加 一 层 。 


4. 引起 索引 结 点 合并 的 删除 操作 


删除 记录 时 ,要 在 叶 结 点 中 删除 被 删 记 录 的 查找 键 值 ,并且 该 值 删除 后 叶 结 点 中 查找 
键 值 数目 小 于 [Gm 一 1)/2 ,那么 这 个 叶 结 点 在 作 技术 处 理 时 有 可 能 被 删 掉 。 
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许多 数据 库 文献 的 文章 以 及 数据 库 专家 习惯 使 用 术语 B 树 指 代 B+ 树 数据 结构 。 事 
实 上 ,B+ 树 的 使 用 比 B 树 广泛 很 多 ,这 样 的 指 代 也 是 合理 的 。 





13.6 散 列 索引 文件 


13.6.1 散 列 技术 


散 列 (hashing) 方 法 是 一 种 不 必 通 过 索引 就 能 访问 数据 的 方法 。 在 散 列 技术 的 基础 
上 结合 索引 方法 可 进一步 提高 访问 效率 。 


1. 散 列 的 概念 


定义 13.2 设 K 是 所 有 查找 键 值 的 集合 ,B 是 所 有 桶 地 址 的 集合 。 散 列 函 数 
(hashing function) hh 是 从 K 到 B 的 一 个 函数 , 它 把 每 个 查找 键 值 K 映像 到 地 址 集合 B 
中 的 地 址 。 

要 插入 查找 键 值 为 K; 的 记录 ,首先 也 是 计算 h(K;), 求 出 该 记录 的 桶 地 址 ,然后 将 这 
条 记录 存储 到 桶 中 ,假定 桶 中 有 容纳 这 条 记录 的 空间 。 

删除 操作 也 一 样 简单 , 先 用 插入 记录 相同 的 查找 方法 把 记录 找到 ,然后 在 相应 的 桶 内 
查找 待 删除 记录 直接 从 桶 内 删 去 即 可 。 


2. 散 列 函数 


使 用 散 列 方法 ,首先 要 有 一 个 好 的 散 列 函数 。 由 于 不 可 能 精确 知道 要 存储 的 记录 的 
查找 键 值 ,因此 要 求 散 列 函数 满足 下 面 两 个 条 件 。 

(1) 地 址 的 分 布 是 均匀 的 : 即 每 个 桶 内 的 查找 键 值 数 目 大抵 相 同 。 

(2) 地 址 的 分 布 是 随机 的 : 散 列 函 数值 不 受 查找 键 值 各 种 顺序 的 影响 ,如 字母 顺序 。 

【 例 13.2】 对 于 图 13. 3 中 的 数据 ,可 以 用 散 列 方法 存储 。 假 设 查找 键 值 是 ENO。 
散 列 函数 用 下 列 方法 设计 : 假设 存储 空间 分 成 10 个 桶 ,对 应 桶 号 为 0 一 9。 把 职工 号 字符 
串 中 的 每 个 数字 求 和 除 以 10, 将 得 到 的 余数 作为 桶 号 ;然后 把 记录 存 和 相应 的 桶 ,如 
图 13.8 所 示 。 

散 列 函 数 设计 得 好 ,各 个 桶 内 的 查找 时 间 相 差 无 几 ,并且 查找 的 平均 时 间 是 最 小 的 。 














3. 桶 溢出 的 处 理 


在 散 列 组织 中 ,每 个 桶 的 空间 是 固定 的 ,如 果 某 个 桶 内 已 装 满 记录 ,还 有 新 记录 要 插 
和 人 到 该 桶 ,那么 称 这 种 现象 为 " 桶 溢出 ”。 

不 管 散 列 函 数 设计 得 如 何 好 , 桶 溢出 现象 难免 还 会 发 生 ,所 以 要 有 一 系列 处 理 溢出 的 
方法 ,具体 如 下 所 述 。 

(1) 溢出 链 法 : 如 果 某 个 桶 已 装 满 记录 ,还 有 新 记录 等 待 插 入 ,那么 可 以 由 系统 提供 
一 个 溢出 桶 ,用 指针 链接 在 桶 后 面 。 如 果 溢 出 桶 也 装 满 了 , 则 在 其 后 面 再 链接 溢出 桶 。 
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桶 0 | 22222 KARL 600 桶 5 | 32343 ALICE 750 
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桶 3 oo | SIRI 600 桶 7 | 12121 | CAROLINE mm| 
15151 | JOE 800 人 8 

桶 4 桶 9 | 58583 KIM 600 











图 13.8 employee 表 的 散 列 结构 


(2) 开放 式 散 列 法 : 这 个 方法 是 把 桶 空间 固定 下 来 ,也 就 是 只 考虑 基本 桶 ,不 考虑 溢 
出 桶 。 如 果 有 一 个 桶 装 满 了 记录 ,那么 就 在 桶 空间 中 挑选 一 个 有 空闲 空间 的 桶 , 装 和 新 
记录 。 

开放 式 散 列 法 在 编译 或 汇编 中 构造 符号 表情 况 下 使 用 频繁 ,但 是 开放 式 散 列 法 的 删 
除 操作 比较 复杂 ,因此 数据 库 系 统 中 使 用 封闭 散 列 法 。 

标志 散 列 结构 装 满 程度 的 因子 a 等 于 存储 记录 的 空间 量 与 给 定 的 存储 空间 量 的 商 。 
如 果 a 二 0. 8, 容 易 产 生 桶 溢出 ;如 果 a 二 0. 6 ,表示 空间 浪费 太 多 。 一 般 a 取 0.6~0.8。 


13.6.2 静态 散 列 索引 


散 列 方法 不 仅 可 以 用 在 文件 组 织 上 ,也 可 以 用 在 索引 结构 上 。 散 列 索引 (hash 
index) 是 把 查找 键 值 与 指针 一 起 组 合成 散 列 文件 结构 的 一 种 索引 。 

散 列 索引 的 构造 方法 如 下 : 首先 为 主 文件 中 每 个 查找 键 值 建立 一 个 索引 记录 ,然后 
把 这 些 索 引 记录 组 织 成 散 列 结构 ( 称 为 “ 散 列 索引 ”) 。 

【 例 13.3】〗 对 图 13. 3 中 的 数据 建立 一 个 散 列 索 引 。 

设 employee 的 查找 键 仍 为 ENO。 这 次 的 散 列 函数 构造 如 下 : 对 工 号 中 的 各 位 数字 
求 和 ,然后 除 以 7 将 得 到 的 余数 作为 索引 的 桶 地 址 (“质数 取 余 法 ”)。 每 个 桶 可 放 2 个 索 
引 记录 ,如 果 超 过 2 个 ,就 要 链接 溢出 桶 。 对 图 13. 3 中 的 数据 建立 的 散 列 索引 如 图 13.9 
所 示 。 

严格 地 讲 , 散 列 索 引 是 一 种 辅助 索引 结构 ,不 属于 主 索引 结构 ,但 可 以 认为 散 列 文件 
组 织 提供 了 一 个 虚拟 的 顺序 散 列 索引 。 

13. 6. 2 节 介 绍 的 散 列 技术 属于 静态 散 列 , 也 就 是 在 散 列 函数 确定 以 后 ,所 有 的 桶 地 
址 及 桶 空间 都 确定 了 。 它 并 不 适应 数据 库 的 快速 增长 ,为 了 克服 静态 散 列 索引 的 缺陷 ,在 
实际 中 往往 使 用 动态 散 列 技术 , 即 桶 空间 可 随时 申请 或 释放 ,而 维护 的 代价 又 不 大 。 
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桶 0 12121 
33456 
桶 1 32343 
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10101 SIRI 600 
桶 2 12121 | CAROLINE | 700 | 
15151 JOE 800 
22222 KARL 600 
桶 3 10101 32343 ALICE 750 
22222 | 33456 ROSE 800 
45565 | REBECCA | 850 
桶 4 45565 58583 KIM 600 
76543 76543 JACK 400 
桶 5 
桶 6 15151 

















图 13.9 employee 表 的 散 列 索引 


第 13. 6. 3 节 介绍 动态 散 列 中 的 一 种 技术 一 一 可 扩充 散 列 结构 。 
13.6.3 可 扩充 散 列 结构 


1. 可 扩充 散 列 结构 的 组 织 方法 


首先 选择 一 个 均匀 性 和 随机 性 都 比较 好 的 散 列 函 数 有 ,并 且 这 个 散 列 函数 产生 的 函 
数值 (简称 * 散 列 值 ”) 较 大 ,是 一 个 由 2 个 二 进 制 位 组 成 的 整数 。 例 如 2 一 32 ,那么 就 有 2” 
个 散 列 值 , 可 以 对 应 22 个 桶 。 但 是 ,每 个 散 列 值 并 不 立即 对 应 一 个 桶 空间 ,而 是 根据 实际 
需要 申请 或 释放 。 

初始 时 ,不 是 根据 全 部 5 位 值得 出 桶 地 址 ,而 是 根据 这 个 5 位 的 前 i 位 (高 位 )(0<i<6b) 
得 出 桶 地 址 值 。 在 数据 增长 过 程 中 , 取 的 位 数 i 也 随 之 增加 。 这 i 位 组 成 的 值 是 一 个 桶 
号 。 所 有 的 桶 地 址 放 在 一 张 “ 桶 地 址 表 ” 中 , 桶 地 址 的 位 置 就 是 桶 号 。 

在 桶 地 址 表 上 方 出 现 的 i 表示 当前 情况 是 取 散 列 值 的 前 i 位 作为 桶 地 址 的 位 置 。 在 
桶 地 址 表 中 ,有 时 可 能 某 几 个 相 邻 的 项 中 的 指针 指向 同一 个 桶 。 每 个 桶 的 上 方 出 现 的 整 


关系 有 局 <i, 这 里 i 是 第 j 个 桶 的 散 列 前 缀 ,指向 第 ; 个 桶 的 指针 数目 是 2 。 
2. 可 扩充 散 列 结构 的 操作 
可 扩充 散 列 结构 的 操作 主要 有 查找 .插入 .删除 3 类。 
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1) 查找 操作 

设 散 列 函 数 为 h(K), 若 查找 键 值 为 Ki , 桶 地 址 表 的 散 列 前 缀 为 i, 那么 首先 求 出 
h(K1) 的 前 i 位 值 mr ,然后 沿 着 桶 地 址 表 位 置 m 处 的 指针 到 达 某 一 个 桶 中 去 找 记录 。 

2) 插入 操作 

要 搬入 一 个 查找 键 值 为 K, 的 记录 ,首先 要 用 查找 操作 找到 应 插入 的 桶 ,譬如 第 7 个 
桶 。 如 果 桶 内 有 空闲 空间 ,直接 插入 即 可 。 如 果 桶 已 装 满 记录 ,那么 必须 分 裂 桶 ,重新 分 
布 记录 ,并 插入 新 记录 。 分 裂 桶 的 过 程 分 成 两 种 情况 考虑 。 

第 一 种 情况 : i=i, 也 就 是 指向 第 j 个 桶 的 指针 只 有 一 个 。 这 时 应 在 桶 地 址 表 中 增加 
项 数 ,以 保证 第 j 个 桶 分 裂 后 ,在 桶 地 址 表 中 有 位 置 存 放 指向 新 桶 的 指针 。 用 增加 散 列 前 级 
的 方法 ,也 就 是 ;的 值 增 1。 也 就 是 每 项 分 裂 成 相 邻 的 两 项 ,此 时 桶 地 址 采用 了 成 倍 扩充 法 ， 
但 存储 数据 的 桶 空间 还 没有 扩大 。 桶 地 址 表 的 空间 要 比 存储 数据 的 桶 空间 小 得 多 。 

此 时 指向 第 7 个 桶 的 指针 就 有 两 个 。 再 申请 一 个 桶 空间 (第 个 桶 ), 置 第 二 个 指针 
值 为 指向 桶 A, 再 置 第 ) 和 第 k 个 桶 的 散 列 前 级 均 为 新 的 i 值 。 接 着 ,把 原来 第 j 个 桶 中 
的 记录 根据 散 列 值 的 前 i 位 (已 增加 1) 重新 分 配 。 再 把 新 记录 插入 到 第 j 或 第 k 个 桶 。 

第 二 种 情况 : i>i; 。 此 时 指向 第 j 个 桶 的 指针 至 少 为 两 个 或 两 个 以 上 ,那么 桶 地 址 
表 不 必 扩 大 。 只 要 分 裂 第 7 个 桶 即 可 。 申 请 一 个 桶 空间 ( 桶 k)。 对 局 的 值 增 1, 置 第 7 个 
桶 的 指针 和 第 个 桶 的 散 列 前 缀 都 为 新 的 i; 值 。 然 后 在 桶 地 址 表 中 原来 指向 第 j 个 桶 的 
指针 中 分 出 后 一 半 指 针 , 指 向 桶 k 的 地 址 ,而 前 一 半 指 针 仍 指向 桶 7。 再 把 第 7 个 桶 中 的 
记录 按 散 列 前 绥 确 定 的 位 数 表 示 的 值 重新 分 配 。 最 后 把 新 记录 插入 到 桶 /或 桶 上 中 。 

3) 删除 操作 

要 删除 查找 键 值 为 Ki 的 记录 ,首先 也 是 先 用 查找 方法 ,把 记录 找到 ,然后 把 记录 从 
所 在 的 桶 内 删除 。 如 果 删 除 后 桶 为 空 ,那么 这 个 桶 也 要 被 删除 ,也 就 是 桶 的 合并 操作 。 有 
时 很 可 能 引起 桶 地 址 表 的 收缩 。 

【 例 13. 4】 对 图 13. 3 所 示 文 件 employee 的 数据 重建 一 个 动态 散 列 文件 结构 。 设 
查找 键 为 ENAME ,有 一 个 散 列 函 数 把 查找 键 值 转换 成 32 位 散 列 值 , 如 图 13. 10 所 示 。 
































ENO ENAME SALARY ENAME h(ENAME) 
10101 SIRI 600 SIRI 0010 1101. 
12121 CAROLINE 700 CAROLINE 1010 O01 
15151 JOE 800 JOE 1100 0101 
22222 KARL 600 KARL 0011 0101 
32343 ALICE 750 ALICE 1111 0001…。 
33456 ROSE 800 ROSE 1011 0001.…-。 
45565 REBECCA 850 REBECCA 1101 1000…-。 
58583 KIM 600 KIM 1000 1011.…-。 
76543 JACK 400 JACK 0111 1101.- 























13. 10 employee 文 件 ENAME 的 散 列 值 (32 位 ,图 中 列 出 前 9 位 ) 
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初始 时 ,文件 为 空 ,假设 每 个 桶 里 只 能 放 两 个 记录 ,把 图 13. 3 所 示 的 记录 一 个 个 插入 到 可 
扩充 散 列 文件 中 。 
插入 所 有 记录 的 可 扩充 散 列 索引 如 图 13. 11 所 示 。 


3 多 
000 10101 SIRI 600 | 桶 0,1 
22222 | KARL | 600 
001 


010 一 二 76543 JACK 400 | 桶 2,3 


























011 一 TY 


100 





58583 KIM 600 | 桶 4 
101 


110 ~ 3 


12121 |CAROLINE| 700 | 桶 5 
I 33456 ROSE 800 






















桶 地 址 表 3 


15151 JOE 800 | 桶 6 
45565 | REBECCA 














桶 7 





图 13.11 搬入 所 有 记录 的 可 扩充 散 列 索引 


13.7 小 结 


数据 库 内 模式 也 称 为 存储 模式 ,是 数据 物理 结构 和 存储 方式 的 描述 。 数据库 系统 内 
模式 涉及 的 数据 结构 有 数据 文件 日 志文 件 、 索 引文 件数 据 字典 和 统计 信息 等 。 

数据 库 系统 的 存储 介质 分 为 基本 存储 、 辅 助 存储 和 三 级 存储 。 

磁盘 中 ,数据 以 文件 形式 存放 。 在 文件 里 ,数据 以 记录 方式 组 织 , 分 为 定 长 记录 与 不 
定 长 记录 。 

数据 文件 结构 有 堆 文件 ,顺序 文件 . 散 列 文件 和 聚集 文件 等 。 

为 了 提高 查找 速度 ,需要 为 文件 建立 索引 。 索 引 有 主 索引 和 辅助 索引 两 种 。 主 索引 
有 稠密 索引 、 稀 朴 索 引 和 多 级 索引 等 形式 。 主 流 的 主 索引 ,尤其 数据 量 大 时 ,是 多 级 索引 
形式 。 索 引 会 增加 数据 库 空 间 开 销 和 更 新 负担 。B+ 树 索引 文件 与 散 列 技术 是 最 常见 的 
两 种 索引 实现 技术 。 
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13.8 习题 


. 简 述 数据 库 内 模式 的 数据 结构 有 哪些 。 
. 数据 文件 有 哪 几 种 ? 

. 简 述 索引 的 分 类 。 

. 什么 是 B+ 树 索引 ? 

. 什么 是 散 列 索引 ? 


am 省 
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第 14 章 ”关系 查询 优化 


14.1 查询 处 理 


查询 处 理 (query processing) 是 指 从 数据 库 中 提取 出 所 需 数据 涉及 的 一 系列 活动 。 
这 些 活动 包括 : 将 用 户 的 数据 库 语 言 翻译 为 能 在 物理 层 上 使 用 的 表达 式 、 优 化 查询 表达 
式 、 执 行 查询 。 


14.1.1 概述 


查询 处 理 的 基本 步骤 包括 语法 分 析 与 检查 \ 查 询 优化 .查询 执行 。 
1. 语法 分 析 与 检查 


查询 开始 执行 之 前 ,系统 必须 将 SQL 语句 表达 的 查询 翻译 成 系统 的 查询 内 部 表示 。 
查询 的 内 部 表示 是 建立 在 扩展 的 关系 代数 基础 上 的 。 这 个 翻译 过 程 类 似 于 编译 器 的 语法 
分 析 ,语法 分 析 器 检查 用 户 查询 的 语法 ,识别 出 查询 语句 里 的 语言 符号 ,如 SQL 关键 字 、 
属性 名 ,关系 名 、 视 图 名 等 ,进行 语法 检查 和 语法 分 析 , 判 断 查 询 语句 是 否 符合 SQL 语法 
规则 、 根 据 数据 字典 中 有 关 的 DDL 定义 验证 查询 里 涉及 的 关系 名 与 视图 名 等 在 数据 库 中 
是 否 有 效 。 如 果 有 视图 ,要 将 对 视图 的 引用 转换 成 对 基本 表 的 引用 。 还 要 根据 数据 字典 
中 的 用 户 权限 定义 和 完整 性 约束 定义 对 查询 语句 涉及 的 权限 与 完整 性 约束 进行 检查 。 如 
果 提 出 查询 的 用 户 没有 相应 的 访问 权限 或 者 违反 了 完整 性 约束 ,就 拒绝 执行 该 查询 。 当 
然 , 这 时 的 完整 性 检查 是 静态 ,初步 的 检查 。 

完成 语法 分 析 与 检查 的 SQL 语句 转换 成 等 价 的 关系 代数 表达 式 , 即 系统 查询 的 内 部 
表达 。 数 据 库 对 象 ,如 关系 、 属 性 ,视图 等 的 外 部 名 称 转换 成 内 部 表示 。 关 系数 据 库 管理 
系统 都 用 查询 树 ( 也 称 为 语法 分 析 树 ) 表 示 扩 展 的 关系 代数 表达 式 。 


2. 查询 优化 

















对 于 一 个 查询 ,一 般 都 会 有 多 种 表达 方式 或 者 计算 结果 的 方法 。 例 如 ,一 个 查询 可 以 
用 几 种 不 同 的 SQL 语句 表示 ,每 个 SQL 查询 可 以 用 其 中 的 一 种 方式 翻译 成 关系 代数 表 
达 式 。 而 查询 的 关系 代数 表达 式 仅 仅 部 分 指定 了 如 何 执行 查询 ,可 以 对 这 个 关系 代数 表 
达 式 用 不 同 的 操作 次 序 和 组 合 来 表达 查询 ,而 这 些 不 同 往往 导致 执行 效率 的 不 同 。 

进一步 ,数据 库 管理 系统 物理 执行 一 个 查询 时 ,还 要 对 关系 代数 表达 式 加 上 注释 来 说 
明 如 何 执行 每 个 操作 。 注 释 可 以 声明 某 个 具体 操作 采用 的 算法 ,或 将 要 使 用 的 一 个 或 多 
个 特定 的 索引 。 加 了 如 何 执行 注释 的 关系 代数 运算 称 为 计算 原 语 。 用 于 执行 一 个 查询 的 
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原 语 操作 序列 称 为 查询 执行 计划 (query-execution plan) 。 查 询 执行 引擎 接受 查询 执行 计 
划 , 并 把 计划 执行 结果 返回 给 查询 。 

同一 查询 的 不 同 执 行 计划 有 不 同 的 代价 。 对 于 数据 库 应 用 系统 ,不 可 能 要 求 用 户 写 
出 具有 最 高 效率 执行 计划 的 查询 语句 ,构造 查询 对 应 的 最 优 查 询 执行 计划 ( 即 查询 优化 ) 
是 数据 库 管 理 系统 的 职责 之 一 ,第 14. 2 节 将 介绍 查询 优化 。 

为 了 优化 查询 ,查询 优化 器 必须 估算 每 个 操作 的 代价 。 精 确 的 计算 代价 很 难 , 但 是 依赖 
数据 字典 的 数据 库 对 象 的 统计 信息 ,依赖 一 些 系统 参数 (例如 该 操作 实际 能 用 的 内 存 ), 对 每 
个 操作 的 执行 代价 做 出 粗略 的 估计 是 可 能 的 。 第 14. 1. 2 节 将 讨论 如 何 度量 操作 代价 。 


3. 查询 执行 


查询 优化 器 生成 的 查询 执行 计划 由 代码 生成 器 (code generator) 生 成 执行 这 个 查询 
计划 的 代码 ,并 将 运行 的 结果 ( 即 查 询 结 果 ) 回 送 到 应 用 程序 客户 端 。 


14.1.2 查询 代价 度量 


查询 处 理 的 代价 可 以 通过 该 查询 对 各 种 资源 的 使 用 情况 进行 度量 ,这 些 资源 具体 包 
括 磁 盘存 取 、 执 行 查询 的 CPU 时 间 .通信 代价 。 

在 大 多 数 大 型 数据 库 系 统 中 ,在 磁盘 上 存 取 数据 花费 的 时 间 是 查询 最 主要 的 代价 ,因为 磁 
盘存 取 速 度 比 内 存 与 CPU 速度 慢 很 多 ,所 以 花费 在 磁盘 存 取 上 的 时 间 决 定 了 整个 查询 执行 的 
大 部 分 时 间 。 一 个 任务 消耗 的 CPU 时 间 难 以 估计 , 它 取决 于 执行 代码 的 底层 详细 情况 ,尽管 
实际 应 用 中 查询 优化 器 的 确 把 CPU 时 间 考 虑 在 内 ,为 了 简化 起 见 , 忽 略 CPU 时 间 , 用 磁盘 存 
取代 价 来 度量 执行 计划 的 代价 : 查询 处 理 的 代价 三 传送 磁盘 块 数 十 搜索 磁盘 次 数 。 

假设 磁盘 子 系统 传输 一 个 块 数据 平均 消耗 t+ 秒 ,磁盘 块 平均 访问 时 间 ( 磁 盘 搜 索 时 
间 加 上 旋转 延迟 ) 为 ts 秒 , 则 一 次 传输 5 个 块 以 及 执行 ; 次 磁盘 搜索 的 操作 将 消耗 5Xir 十 
sXis 秒 。tr 和 1s 的 值 必 须 针 对 使 用 的 磁盘 系统 进行 计算 ,而 磁盘 系统 的 典型 数据 通常 
是 女王 0. 1ms,ts 二 4ms, 假 定 磁盘 块 的 大 小 是 4KB, 传 输 率 为 40MB/s。 

写 磁 盘 块 的 代价 通常 是 读 磁盘 块 的 两 倍 (由 于 磁盘 系统 在 写 完 扇 区 后 还 会 重新 读 取 
该 扇 区 ,以 验证 写 操作 已 经 成 功 ) 。 

查询 执行 计划 算法 代价 依赖 于 主 存 缓冲 区 的 大 小 。 最 好 的 情形 是 所 有 数据 可 以 读 入 
到 缓冲 区 ,不 必 再 访问 磁盘 。 最 坏 的 情况 是 假定 缓冲 区 只 能 容纳 数目 不 多 的 数据 块 一 
大 约 每 个 关系 一 块 。 设 计 估算 代价 时 ,假定 最 坏 的 不 乐观 的 情形 ,假定 执行 开始 时 数据 
必须 从 磁盘 中 读 出 来 。 所 以 ,很 可 能 在 查询 计划 执行 时 ,需要 访问 的 磁盘 块 已 经 在 内 存 缓 
冲 区 中 。 所 以 ,执行 一 个 查询 执行 计划 的 实际 磁盘 存 取代 价 可 能 会 比 估算 的 代价 小 。 


14.2 查询 优化 

















对 于 一 个 给 定 查询 ,尤其 是 复杂 的 查询 ,系统 可 以 有 许多 种 可 能 的 执行 策略 ,好 的 查询 
策略 和 差 的 查询 策略 在 执行 代价 上 (执行 时 间 ) 通 常会 有 相当 大 的 区 别 ,可 能 相差 好 几 个 数 
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量 级 ,因此 ,系统 为 查询 处 理 选 择 一 个 好 的 策略 而 付出 额外 的 时 间 开 销 是 完全 值得 的 。 
不 可 能 要 求 用 户 写 出 一 个 能 高 效 处 理 的 查询 ,但 是 系统 应 该 构造 一 个 等 价 的 让 查询 
执行 代价 最 小 化 的 查询 执行 计划 , 即 查询 优化 。 


14.2.1 查询 优化 概述 


为 了 达到 用 户 可 以 接受 的 性 能 ,系统 必须 进行 查询 优化 ;而 恰好 关系 表达 式 的 语义 
级 别 很 高 ,关系 数据 库 管理 系统 可 以 分 析 关 系 式 的 语义 ,对 其 进行 优化 。 查 询 优化 使 
得 关系 系统 在 性 能 上 接近 甚至 超过 非 关系 系统 。 查 询 优化 是 关系 数据 库 系 统 的 关键 
技术 。 关 系数 据 库 系统 及 其 SQL 之 所 以 广泛 流行 ,很 大 程度 得 益 于 查询 优化 技术 的 发 
展 成 熟 。 

关系 系统 中 ,用 户 使 用 非 过 程 化 的 语言 表达 查询 要 求 , 用 户 只 需要 描述 干什么 ,不 
必 指 出 怎么 干 ,用户 选择 数据 存 取 路 径 的 负担 大 大 减轻 。 对 比 非 关 系 系统 ,用 户 需要 
了 解数 据 的 存 取 路 径 , 查 询 的 效率 由 用 户 的 查询 策略 决定 ;如 果 用 户 做 了 不 当选 择 , 系 
统 不 能 对 此 加 以 改进 。 这 实际 上 要 求 非 关系 系统 的 用 户 具有 较 高 的 数据 库 技术 和 程 
序 设 计 水 平 。 

让 DBMS 做 查询 优化 ,不 仅 可 以 让 用 户 关注 查询 问题 本 身 , 不 需 考虑 如 何 表达 查询 ， 
以 获得 较 高 的 效率 ,而 且 系 统 优化 比 用 户 程 序 优化 做 得 更 好 。 系 统 的 查询 优化 器 可 以 从 
数据 字典 获取 许多 统计 信息 (如 关系 的 元 组 数 、 关 系 每 个 属性 值 的 分 布 情况 ,哪些 属性 上 
建立 了 索引 等 ) ,优化 器 可 以 根据 这 些 信 息 做 出 估算 ,选择 高 效 的 执行 计划 ,用 户 程序 难以 
做 到 ;并 且 如 果 物 理 统计 信 息 改变 了 ,系统 会 自动 更 新 数据 字典 ,自动 调整 查询 执行 计划 。 
系统 优化 器 可 以 利用 很 多 复杂 的 优化 技术 ,同时 考虑 比较 数 百 种 不 同 的 执行 计划 ,用 户 程 
序 更 加 难以 企及 。 

实际 系统 的 查询 优化 步骤 如 下 。 

(1) 将 查询 转换 成 某 种 内 部 表示 ,通常 是 语法 树 。 

(2) 根据 一 定 的 等 价 变换 规则 把 语法 树 转 换 成 标准 (优化 ) 形 式 。 

(3) 选择 低层 的 操作 算法 : 对 于 语法 树 中 的 每 个 操作 ,计算 各 种 执行 算法 的 执行 代 
价 ,选择 代价 小 的 执行 算法 。 

(4) 生成 查询 计划 (查询 执行 方案 )。 查 询 计 划 是 由 一 系列 内 部 操作 组 成 的 。 

查询 优化 主要 分 为 代数 优化 ( 即 上 述 优化 步骤 的 步骤 (2) ) 与 物理 优化 ( 即 上 述 优化 步 
又 的 步骤 (3)) 。 

查询 优化 的 总 目标 是 选择 有 效 的 策略 , 求 得 给 定 关系 表达 式 的 值 , 使 得 查询 代价 较 
小 。 而 查询 优化 的 搜索 空间 实际 是 非常 大 的 ,因此 实际 系统 选择 的 策略 不 一 定 是 最 优 的 ， 
而 是 较 优 的 。 





14.2.2 代数 优化 


14. 1 节 讲 解 了 SQL 语句 经 过 语法 分 析 与 翻译 后 变换 为 关系 代数 表达 式 的 内 部 表 
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示 一 一 语法 查询 树 , 本 节 介 绍 基于 关系 代数 等 价 变化 规则 的 优化 方法 一 一 代数 优化 。 


代数 优化 策略 通过 对 关系 代数 表达 式 的 等 价 变换 来 提高 查询 效率 ,只 改变 查询 语句 


中 操作 的 次 序 与 组 合 ,不 涉及 底层 的 存 取 路 径 。 


1. 关系 代数 表达 式 等 价 变换 规则 
关系 代数 表达 式 的 等 价 是 指 用 相同 的 关系 代替 两 个 代数 表达 式 中 相应 的 关系 所 得 到 


的 结果 是 相同 的 。 如 果 两 个 关系 代数 表达 式 在 每 个 数据 库 实 例 中 都 会 产生 相同 的 元 组 集 
合 ,这 两 个 表达 式 有 可 能 以 不 同 的 顺序 产生 元 组 ,而 元 组 的 顺序 是 无 关 紧 要 的 ,因此 只 要 
元 组 集合 内 容 一 致 ,就 认为 两 者 等 价 。 


等 价 规则 指出 两 种 不 同形 式 的 表达 式 是 等 价 的 。 第 一 种 可 以 代替 第 二 种 ,反之 亦 然 。 


优化 器 利用 等 价 规则 将 表达 式 转换 成 逻辑 上 等 价 的 其 他 表达 式 。 两 个 关系 表达 式 El 和 
E2 是 等 价 的 , 记 为 El 三 E2。 


下 面 列 出 关系 代数 表达 式 的 通用 等 价 规则 。 
(1) 连接 、 笛 卡 儿 积 交换 律 。 
设 El 和 E2 是 关系 代数 表达 式 ,F 是 连接 运算 的 条 件 , 则 有 : 
El1XE2=E2XEIl 
Elw E2=E2m El 
El YW E2=E2% El 
(2) 连接 、 笛 卡 儿 积 的 结合 律 。 
设 El1、E2、E3 是 关系 代数 表达 式 ,F1 和 F2 是 连接 运算 的 条 件 , 则 有 : 
(El1X E2) x E3=E1X (E2XE3) 
(El w E2)w E3=E] w(E2 w E3) 
(El ¥ E2)% E3=E1 ¥(E2 % E3) 
(3) 投影 的 串 接 定律 。 
天 三 了 (了 E) 
这 里 ,E 是 关系 代数 表达 式 , Ai(i= 二 1,2,…,n), Bj(j 二 1,2,…,m) 是 属性 名 ,并 且 


{Al，A2,…,An} 构 成 {Bl1,B2,… ,Bm)} 的 子 集 。 


(4) 选择 的 串 接 定律 。 
or (ors (E)) 三 ornrz (E) 
这 里 ,E 是 关系 代数 表达 式 ,Fl 和 F2 是 选择 条 件 。 选 择 的 串 接 定律 说 明 选择 条 件 可 


以 合并 ,这 样 一 次 就 可 检查 全 部 条 件 。 
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(5) 选择 与 投影 操作 的 交换 律 。 
如 果 选 择 条 件 F 只 涉及 属性 Al ,…,An, 则 交换 律 表达 如 下 
oF (IAAz,， ,An( 上 ) ) IAAz,， An(Cor(E)) 
若 F 中 有 不 属于 Al1, …',An 的 属性 Bl1,… ,Bm, 则 有 更 一 般 的 交换 律 : 
IIAli,Az,，,An(aF (E)) S [lai,az,.,An (OF (TA,A2,.,An,Bl,B2,..,Bn (E) )) 


酒 


(6) 选择 与 笛 卡 儿 积 的 交换 律 。 
如 果 下 中 涉及 的 属性 都 是 El 中 的 属性 , 则 有 : 
or (El X E2) = or (El1) X E2 
如 果 下 = 二 Fl1AF2, 并 且 Fl 只 涉及 El 中 的 属性 ,F2 只 涉及 E2 中 的 属性 , 则 由 上 面 的 
等 价 变换 规则 (1)、(4)、(6) 可 推出 : 
oF (El X E2) = om (El1) X om (E2) 
如 果 下 二 Fl1A 人 F2,F1l 只 涉及 El 中 的 属性 ,F2 涉及 El 和 E2 两 者 的 属性 ,选择 与 笛 
卡 儿 积 的 交换 律 表 达 为 
oF (El X E2) = or (om (El1) XE2) 
它 使 部 分 选择 在 笛 卡 儿 积 前 先 做 。 
(7) 选择 与 并 运算 的 交换 律 。 
假设 E=El1UE2,E1、E2 有 相同 的 属性 名 , 则 有 : 
or (El U E2) = or (El1) U or (E2) 
(8) 选择 与 差 运 算 的 交换 律 。 
假设 El 与 E2 有 相同 的 属性 名 , 则 有 : 
or (El — E2) = or (El1) — or (E2) 
(9) 选择 对 自然 连接 的 分 配 律 。 
oF (El WE2) = or (El1) Wor (E2) 
这 里 ,F 只 涉及 El 与 E2 的 公共 属性 。 
(10) 投影 与 笛 卡 儿 积 的 交换 律 。 
设 El 和 E2 是 两 个 关系 表达 式 ,Al,…,An 是 El 的 属性 ,Bl1,…,Bxm 是 E2 的 属 
性 , 则 : 
I a Mi i Bl XE2)S Tm, sm (BY X Hs, ue (E2) 
(11) 投影 与 并 运算 的 交换 律 。 
设 El 和 E2 有 相同 的 属性 名 , 则 : 
大寺 天 


2. 基于 启发 式 规则 的 代数 优化 


对 于 关系 代数 表达 式 的 图 形 化 表示 一 一 语法 查询 树 ,典型 的 代数 优化 启发 式 规则 
如 下 。 

(1) 选择 运算 应 尽 可 能 先 做 。 这 是 优化 规则 中 最 重要 、 最 基本 的 一 条 。 因 为 先 做 选 
择 运算 可 以 使 中 间 关 系 大 大 变 小 ,执行 代价 可 以 数量 级 减 小 。 

(2) 投影 运算 和 选择 运算 同时 做 。 如 果 有 若干 个 投影 运算 和 选择 运算 对 同一 个 关系 
操作 , 则 可 以 在 扫描 此 关系 的 同时 完成 所 有 这 些 运算 ,以 避免 重复 扫描 关系 。 

(3) 将 投影 运算 与 其 前 或 其 后 的 双 目 运算 结合 。 没 必要 为 了 去 掉 某 些 字 段 而 扫描 一 
饥 关系 。 

(4) 把 某 些 选择 同 在 其 前 面 的 笛 卡 儿 积 结合 起 来 成 为 一 个 连接 运算 。 连 接 运算 特 别 
是 等 值 连接 要 比 同样 关系 上 的 笛 卡 儿 积 的 执行 代价 小 很 多 。 
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(5) 找 出 公共 子 表达 式 。 如 果 重 复出 现 的 公共 子 表达 式 结果 不 大 ,并 且 从 外 存 读 入 
这 个 关系 比 计算 该 子 表 达 式 的 执行 代价 小 , 则 先 计算 出 公共 子 表达 式 的 结果 写 入 临时 文 
件 。 当 利用 视图 执行 查询 时 ,定义 视图 的 语句 就 是 公共 子 表 达 式 的 情况 。 

根据 启发 式 规则 ,应 用 表达 式 等 价 变换 公式 优化 关系 表达 式 的 代数 优化 算法 描述 
如 下 。 

算法 : 关系 表达 式 的 优化 。 

输入 : 一 个 关系 表达 式 的 语法 树 。 

输出 : 计算 该 表达 式 的 程序 。 

算法 步骤 如 下 。 

第 一 步 ; 分 解 选 择 运算 ,利用 等 价 规 则 (4) 把 形 如 oreh..Am (E) 的 形式 变换 为 
om (ors (""* (gpa (E)).) ) 形 式 。 

第 二 步 ; 交换 选择 运算 ,将 其 尽 可 能 移 到 叶 端 ,利用 规则 (4) 一 (9) 尽 可 能 把 每 个 选择 
移 到 树 的 叶 端 。 

第 三 步 ; 交换 投影 运算 ,将 其 尽 可 能 移 到 叶 端 ,利用 规则 (3)、(5)、(10)、(11) 中 的 一 
般 形式 尽 可 能 把 每 个 投影 移 向 树 的 叶 端 。 

第 四 步 : 合并 同一 关系 上 串 接 的 选择 和 投影 ,以 便 能 同时 执行 这 些 操作 或 在 一 次 扫 
描 中 完成 这 些 操作 。 利 用 规则 (3)、(4)、(5) 把 选择 和 投影 的 串 接合 并 成 单个 选择 .单个 投 
影 或 一 个 选择 后 跟 一 个 投影 的 形式 。 由 于 投影 或 者 选择 操作 是 对 同一 个 关系 的 操作 ,这 
样 处 理 的 效果 是 使 多 个 选择 或 投影 能 同时 执行 ,或 在 一 次 扫描 中 全 部 完成 。 

第 五 步 : 将 经 过 上 述 步骤 得 到 的 语法 树 的 内 结 点 分 组 : 每 一 双 目 运算 (Xm、U .一 ) 
和 它 所 有 的 直接 祖先 划分 为 一 组 (这 些 直接 祖先 是 o、 呈 运算 )。 如 果 其 后 代 直 到 叶子 全 
是 单 目 运算 , 则 也 将 它们 并 入 该 组 ,但 当 双 目 运算 是 笛 卡 儿 积 (X) ,并 且 其 后 的 选择 运算 
不 能 与 它 结合 为 等 值 连接 时 除外 。 这 种 情况 的 单 目 运算 单独 分 为 一 组 。 

(6) 生成 程序 。 生 成 一 个 程序 ,第 五 步 划分 的 每 组 结 点 的 计算 是 程序 中 的 一 步 。 各 
步 的 顺序 是 任意 的 ,只 要 保证 任何 一 组 的 计算 不 会 在 它 的 后 代 组 之 前 计算 即 可 。 


3. 代数 优化 实例 


【 例 14.1】 对 于 学 生 选 课 关 系数 据 库 ， 

student(SNO,SNAME,SSEX,SAGE,SDEPT) 关 系 模式 存放 学 生 基 本 信息 ,包括 学 
号 、 姓 名、 性 别 、 年 龄 、 系 名 ; 

scCSNO,CNO,GRADE) 关 系 模式 存放 选课 信息 ,包括 选课 学 生 的 学 号 .课程 号 、 
成 绩 ; 

course(CNO,CNAME,CPNO,CCREDIT) 关 系 模式 存放 课程 信息 ,包括 课程 号 、 课 
程 名 、 先 修 课 号 .学 分 。 

执行 查询 语句 , 求 选修 了 “信息 系统 ”的 女 同 学 的 学 号 与 姓名 。 该 查询 语句 的 关系 代 
数 表达 式 如 下 : 

JIsNo,sNAME (OCNAME=' 信 息 系统 '\SSEX=' 女 '( 了 [1 (astudent SNO=se. SNOAse CNO=course. CNO (Student X 


sc X course)))) 
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此 处 ,L 是 属性 {student. SNO,SNAME, SSEX, SAGE, SDEPT, course. CNO， 
GRADE,CNAME,CPNO,CCREDIT 的 集合 (3 个 表 自 然 连 接 的 属性 集合 ) 。 
将 等 价 的 表达 式 构成 初始 语法 树 如 图 14. 1 所 示 。 


[lstudent. SNO,SNAME 
GOCNAME= ' 信 息 系统 ' 人 SSEX=' 女 ' 
TIstudent SNO, SNAME, SSEX, SAGE, SDEPT, 


course. CNO, GRADE, CNAME, CPNO, CCREDIT 


Gstudent. SNO=sc.SNO 人 se.CNO=course, CNO 





Ea 
> SR 


student SC 


14.1 例 14.1 初始 语法 查询 树 











使 用 优化 算法 对 初始 语法 树 进 行 优化 。 
将 选择 运算 与 投影 运算 尽量 往 叶 端 放 。 优 化 后 的 语法 树 如 图 14. 2 所 示 。 





14.2.3 物理 优化 


对 于 一 个 查询 语句 ,代数 优化 后 得 到 的 关系 代数 语法 树 可 以 有 多 种 执行 这 个 语法 树 
的 算法 ,多 种 存 取 路 径 , 也 就 是 代数 优化 后 的 查询 可 以 有 许多 存 取 方案 ,这 些 方案 执行 效 
率 各 不 相同 ,有 的 执行 时 间 会 相差 很 大 ,因此 要 继续 进行 物理 优化 。 

物理 优化 就 是 选择 高 效 合理 的 操作 算法 或 者 存 取 路 径 , 求 得 优化 的 查询 计划 ,达到 执 


行 代价 的 优化 。 

物理 优化 的 常用 方法 有 如 下 。 

基于 规则 的 启发 式 优化 。 启 发 式 规则 是 指 那些 在 大 多 数 情况 下 适用 ,但 不 是 每 种 情 
况 下 都 是 最 好 的 规则 。 

基于 代价 估算 的 优化 。 使 用 查询 优化 器 估算 不 同 执行 策略 的 代价 , 选 出 其 中 具有 最 
小 代价 的 执行 计划 。 


两 者 结合 的 优化 方法 。 查 询 优 化 器 通常 会 把 这 两 种 技术 结合 在 一 起 使 用 。 因 为 可 能 
的 执行 策略 很 多 ,要 穷尽 所 有 的 策略 进行 代价 估算 往往 是 不 可 行 的 ,因为 估算 需要 代价 ， 
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Tstudent. SNO, SNAME 


Gsc. CNO=course. CNO 


x 


JJstudent SNO, SNAME, TIcourse. CNO 
sc. CNO 








Gstudent. SNO=sc. SNO ”OCNAME=' 信 息 系统 ' 








ee xX ~ Course 


[lstudent SNO, SNAME [lsc. SNO, sc. CNO 








GOSSEX= 女 





student 


14.2 优化 后 的 语法 树 


对 所 有 策略 都 估算 代价 选 出 最 优 的 很 可 能 造成 查询 优化 本 身 付 出 的 代价 大 于 获得 的 益 
处 。 因 此 ,结合 启发 式 规则 与 代价 估算 , 先 使 用 启发 式 规则 ,挑选 若干 较 优 的 候选 方案 , 减 
少 代价 估算 的 工作 量 , 然 后 分 别 计算 这 些 候选 方案 的 执行 代价 ,从 中 选 出 最 优 方案 。 


1. 基于 启发 式 规则 的 物理 优化 


基于 启发 式 规则 的 物理 优化 通常 是 指 存 取 路 径 和 低层 操作 算法 的 选择 。 下 面 介绍 最 
常用 的 物理 优化 启发 式 规则 。 

1) 选择 操作 的 物理 优化 启发 式 规则 

对 于 小 型 关系 ,使 用 全 表 顺 序 扫描 ,即使 选择 列 上 有 索引 。 

对 于 大 型 关系 ,启发 式 规则 有 以 下 几 种 。 

对 于 选择 条 件 是 “ 主 码 == 值 ”的 查询 ,也 就 是 查询 结果 是 空 或 者 唯一 一 个 元 组 ,可 以 选 
择 主 码 上 的 索引 。 一 般 的 关系 数据 库 系统 在 主 码 上 会 自动 创建 一 个 唯一 属性 的 聚集 
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索引 。 

对 于 选择 条 件 是 “ 非 主 属性 = 值 ” 的 查询 ,并 且 非 主 属性 列 上 建 有 索引 ,查询 优化 器 会 
利用 数据 字典 的 统计 信息 估算 一 下 查询 结果 涉及 的 元 组 数目 ,如 果 结 果 元 组 行 数目 小 于 
关系 元 组 行 数目 的 百 分 之 十 ,就 使 用 索引 扫描 方法 ,否则 使 用 全 表 顺 序 扫描 。 

对 于 选择 条 件 是 属性 上 的 非 等 值 查询 或 者 范围 查询 ,并 且 选 择 列 上 有 索引 ,同样 要 估 
算 查询 结果 的 元 组 数目 ,如 果 结 果 元 组 行 数 目 小 于 关系 元 组 行 数目 的 百 分 之 十 ,就 使 用 索 
引 扫 描 方法 ,否则 使 用 全 表 顺 序 扫描 。 

对 于 使 用 AND 连接 的 复合 选择 条 件 , 如 果 有 涉及 这 些 属 性 的 组 合 索 引 , 就 优先 采用 
组 合 索 引 扫 描 ; 如 果 某 个 属性 上 有 一 般 索引 ,可 以 利用 该 索引 找到 符合 涉及 该 属性 单条 件 
的 记录 指针 集 ,再 对 集合 里 涉及 的 记录 测试 是 否 符合 其 他 条 件 。 

对 于 使 用 OR 连接 的 复合 选择 条 件 ,一 般 使 用 全 表 顺 序 扫描 。 

2) 连接 操作 的 物理 优化 启发 式 规则 

如 果 两 个 关系 都 已 经 按照 连接 属性 排序 , 则 选用 归并 连接 算法 。 

如 果 一 个 关系 在 连接 属性 上 有 索引 , 则 可 以 选用 索引 符 套 循环 连接 算法 。 

如 果 上 面 两 个 规则 都 不 适用 ,其 中 一 个 关系 较 小 , 则 可 以 选用 散 列 连接 算法 。 

和 否则 可 以 选用 嵌 套 循环 算法 ,并且 选择 其 中 较 小 的 关系 (但 不 能 完全 放 在 内 存 里 ), 即 
占用 的 磁盘 块 数 较 少 的 表 , 作 为 外 部 关系 (外 循环 的 表 )。 如 果 两 个 关系 中 的 某 一 个 关系 
小 到 能 完全 放 在 内 存 里 ,那么 就 将 这 个 小 的 关系 作为 内 层 关 系 来 处 理 , 这 样 可 以 减少 很 多 
LI/O 操作。 这 时 内 层 关系 常 驻 内 存 反复 被 扫描 ,外 层 关系 逐 块 读 入 即 可 。 

实际 的 关系 数据 库 管理 系统 中 代数 优化 启发 式 规则 要 多 很 多 ,本 节 只 展示 最 主要 的 。 
启发 式 规则 是 定性 选择 ,实现 简单 并 且 优 化 选择 本 身 代价 小 ,特别 适合 解释 执行 的 系统 。 
因为 解释 执行 的 数据 库 系统 ,优化 开销 包含 在 查询 总 代价 中 。 


2. 基于 代价 估算 的 物理 优化 


编译 执行 数据 库 系统 中 ,一 次 编译 优化 ,多 次 执行 ,查询 优化 与 查询 执行 是 分 开 的 。 
因此 ,可 以 采用 更 精细 的 物理 优化 方法 。 

基于 代价 的 物理 优化 需要 计算 各 种 操作 算法 的 执行 代价 ,很 多 时 候 执行 代价 与 数据 
库 状 态 密切 相关 。 为 此 ,数据 库 内 模式 在 数据 字典 中 设计 存储 了 查询 优化 器 需要 的 统计 
信息 ,其 统计 内 容 主 要 包括 如 下 。 

对 于 每 个 基本 关系 ,统计 关系 的 元 组 个 数 (N) .元 组 长 度 、 占 用 的 块 数 、 占 用 的 溢出 
块 数 。 

对 于 每 个 基本 关系 的 每 个 属性 ,统计 该 属性 不 同 取 值 的 个 数 (m)、 属 性 取 值 的 最 大 
值 . 最 小 值 .该 属性 上 是 否 创 建 了 索引 、 是 哪 种 索引 (B+ 树 索 引 、 散 列 索 引 、 聚 集 索 引 ) ,以 
及 根据 这 些 统计 信息 计算 出 谓词 条 件 的 选择 率 ( 了) ,如 果 不 同 值 的 分 布 是 均匀 的 , 则 f= 
1/m; 如 果 不 同 值 的 分 布 不 均匀 , 则 要 计算 每 个 值 的 选择 率 ,f 二 具有 该 值 的 元 组 数目 /NN。 

对 于 索引 ,如 B+ 树 索引 ,统计 该 索引 的 层 数 、 不 同 索 引 值 的 个 数 、 索 引 的 选择 基数 S 
(有 5S 个 元 组 具有 某 一 索引 值 )、 索 引 的 叶 结 点 数 。 
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14.3 小 结 


查询 处 理 是 关系 数据 库 管理 系统 的 核心 。 查 询 优化 技术 是 查询 处 理 的 关键 技术 。 

查询 处 理 是 数据 库 管理 系统 执行 查询 语句 的 过 程 ,包括 从 数据 库 中 提取 出 所 需 数据 
涉及 的 一 系列 活动 。 这 些 活动 包括 : 将 用 户 的 高 层 数 据 库 语言 翻译 为 能 在 文件 系统 物理 
层 上 使 用 的 表达 式 、 优 化 查询 表达 式 、 执 行 查询 。 查 询 处 理 的 基本 步骤 包括 语法 分 析 与 翻 
译 \ 查 询 优化 查询 执行 。 

查询 处 理 的 代价 可 以 通过 该 查询 对 各 种 资源 的 使 用 情况 进行 度量 ,这 些 资源 具体 包 
括 磁盘 存 取 、 执 行 查询 的 CPU 时 间 、 通 信 代 价 等 。 其 中 ,在 磁盘 上 存 取 数据 是 最 主要 的 
代价 ,因为 磁盘 存 取 速 度 比 内 存 操作 速度 慢 。 为 简化 起 见 , 忽 略 CPU 时 间 , 用 磁盘 存 取 
代价 来 度量 执行 计划 的 代价 : 查询 处 理 的 代价 三 传送 磁盘 块 数 十 搜索 磁盘 次 数 。 

给 定 一 个 查询 ,通常 有 许多 计算 这 个 查询 的 方案 。 将 用 户 输入 的 查询 语句 转换 成 为 
等 价 的 ,执行 效率 更 高 的 查询 语句 ,是 查询 优化 的 目标 。 

查询 优化 主要 分 为 代数 优化 与 物理 优化 。 

代数 优化 策略 通过 对 关系 代数 表达 式 的 等 价 变换 来 提高 查询 效率 ,改变 查询 语句 中 
操作 的 次 序 与 组 合 ,不 涉及 底层 的 存 取 路 径 。 

物理 优化 就 是 选择 高 效 合理 的 操作 算法 或 者 存 取 路 径 , 求 得 优化 的 查询 计划 ,达到 执 
行 代价 的 优化 。 

物理 优化 的 常用 方法 有 : 基于 规则 的 启发 式 优化 、 基 于 代价 估算 的 优化 、 两 者 结合 的 
优化 。 


14.4 习题 


. 什么 是 查询 处 理 ? 

. 如 何 估算 查询 代价 ? 

. 简 述 代数 优化 算法 。 

. 常用 的 物理 优化 方法 有 哪些 ? 


> 
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第 15 章 ”数据库 安全 


数据 库 的 安全 性 (security) 是 指 保护 数据 库 , 防 止 不 合法 的 使 用 ,造成 数据 泄密 、 更 改 
或 者 破坏 。 安 全 性 问题 并 不 是 数据 库 系 统 所 独 有 ,只 是 数据 库 系统 中 集中 存放 了 大 量 数 
据 , 其 中 不 乏 敏 感 、 隐 私 数据 ,从 而 使 得 安全 性 问题 尤为 突出 。 因 此 ,安全 性 措施 是 否 行 之 
有 效 成 为 数据 库 行 业 衡量 数据 库 产品 的 一 项 重要 技术 指标 。 

数据 库 系统 提供 的 安全 措施 主要 有 用 户 身份 鉴别 . 存 取 控 制 、 视 图 审计、 数据 加 


15.1 数据 库 安 全 概述 


随 着 网 络 技术 的 发 展 ,计算 机 系统 (数据 库 系统 ) 的 安全 性 越 来 越 重 要 ,为 此 ,行业 在 
安全 技术 方面 逐步 发 展 建立 了 一 套 可 信 (trusted) 计 算 机 系统 (数据 库 系统 ) 的 概念 和 标 
准 。 符 合 某 一 级 别 的 数据 库 产品 才能 被 认为 是 安全 、 可 信 的 数据 库 。 

安全 标准 里 最 具 代 表 性 的 是 TCSEC 和 CC 两 个 标准 。 


15.1.1 TCSEC 标准 


TCSEC 是 指 1985 年 美国 国防 部 (Department of Defense,DoD) 正 式 颁 布 的 (DoD 可 
信 计 算 机 系统 评估 准则 》(TCSEC 或 DoD85)。 

TCSEC 又 称 橘 皮 书 。1991 年 ,美国 国家 计算 机 安全 中 心 (National Computer 
Security Center,NCSC) 颁 布 了 (可 信 计 算 机 系统 评估 准则 关于 可 信 数 据 库 系统 的 解释 》 
(TCSEC/Trusted Database Interpretation,TCSECVTDI, 即 紫 皮 书 ) ,将 TCSEC 扩展 到 
数据 库 管 理 系 统 。TCSEC/TDI 中 定义 了 数据 库 管理 系统 的 设计 与 实现 中 需要 满足 和 用 
以 进行 安全 性 级 别 评估 的 标准 ,从 4 个 方面 描述 安全 性 级 别 的 划分 指标 , 即 安全 策略 、 责 
任 、 保 证 和 文档 。 每 个 方面 可 细 分 为 若干 项 。 

根据 计算 机 系统 对 各 项 指标 的 支持 情况 ,TCSEC/TDI 将 系统 划分 为 4 组 7 个 等 级 ， 
依次 是 D.C(C1、C2)、B(B1、B2、B3)、A(A1), 按 系统 可 靠 性 或 者 可 信 程 度 逐 渐 增 高 ,如 
表 15.1 所 示 。 


表 15.1 TCSEC/TDI 安全 级 别 划分 








安全 级 别 定义 
Al 验证 设计 (Verified Design) 
B3 安全 域 (Security Domains) 
B2 结构 化 保护 (Structural Protection) 
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续 表 
安全 级 别 定 稀 
Bl 标记 安全 保护 (Labeled Security Protection) 
C2 受 控 的 存 取保 护 (Controlled Access Protection) 
Ci 自主 安全 保护 (Discretionary Security Protection) 
D 最 小 保护 (Minimal Protection) 





D 级 : D 级 是 最 低级 别 。 一 切 不 符合 更 高 标准 的 系统 都 归于 D 组 。 

C1 级: 该 级 只 提供 非常 初级 的 自主 安全 保护 ,能 够 实现 对 用 户 和 数据 的 分 离 , 进 行 
自主 存 取 控 制 (DAC) ,保护 或 限制 用 户 权限 的 传播 。 现 有 的 商业 系统 稍 作 改 进 即 可 满足 
Cl 级 要 求 。 

C2 级 : 实际 是 安全 产品 的 最 低档 次 ,提供 受 控 的 自主 存 取 保护 ,即将 Cl 级 的 DAC 
进一步 细 化 ,以 个 人 身份 注册 负责 ,并 实施 审计 和 资源 隔离 。 很 多 商业 产品 已 得 到 该 级 别 
的 认证 。 

Bl 级 : 标记 安全 保护 。 对 系统 的 数据 加 以 标记 ,并 对 标记 的 主体 和 客体 实施 强制 存 
取 控 制 (MAC) 以 及 审计 等 安全 机 制 。B1 级 能 够 较 好 地 满足 大 型 企业 或 一 般 政府 部 门 对 
于 数据 的 安全 需求 ,这 一 级 别 的 产品 才 被 认为 是 真正 意义 上 的 安全 产品 。 满 足 此 级 别 的 
产品 前 一 般 多 冠 以 “安全 (security) ”或 “可 信 (trusted)” 字 样 , 作 为 区 别 于 普通 产品 的 安全 
产品 出 售 。 

B2 级 : 结构 化 保护 。 建 立 形式 化 的 安全 策略 模型 ,并 对 系统 内 的 所 有 主体 和 客体 实 
施 DAC 和 MAC。 从 互联 网 上 的 最 新 资料 看 ,经 过 认证 的 B2 级 以 上 的 安全 系统 非常 
稀少 。 

B3 级 : 安全 域 。 该 级 的 TCB( 可 信 计 算 库 ) 必 须 满足 访问 监控 器 的 要 求 ,审计 跟踪 能 
力 更 强 , 并 提供 系统 恢复 过 程 。 

Al 级: 验证 设计 , 即 提供 B3 级 保护 的 同时 给 出 系统 的 形式 化 设计 说 明和 验证 ,以 确 
信 各 安全 保护 真正 实现 。 

B2 及 以 上 级 的 系统 标准 很 多 还 处 于 理论 研究 阶段 .产品 化 、 商 品 化 的 程度 都 不 高 ,其 
应 用 也 多 限于 一 些 特殊 的 部 门 ,如 军队 等 。 有 兴趣 的 读者 可 以 查阅 相关 信息 安全 手册 。 

TCSEC/TDI 安全 级 别 下 ,支持 自主 存 取 控 制 的 数据 库 管理 系统 大 致 属于 C 级 ,而 支 
持 强 制 存 取 控 制 的 数据 库 管理 系统 则 可 以 达到 Bl 级。 当然 , 存 取 控制 仅 是 安全 性 标准 
的 一 个 重要 方面 (安全 策略 方面 ), 但 不 是 全 部 。 为 了 使 DBMS 达到 一 定 的 安全 级 别 , 还 
需要 在 其 他 3 个 方面 提供 相应 的 支持 。 例 如 ,审计 功能 就 是 DBMS 达到 C2 以 上 安全 级 
别 必 不 可 少 的 一 项 指标 。 


15.1.2 CC 标准 


在 TCSEC 推出 后 的 10 余年 ,不 同 国家 、 组 织 相继 启动 开发 建立 在 TCSEC 概念 之 上 
的 计算 机 系统 安全 的 评估 准则 ,如 欧洲 的 信息 技术 安全 性 评估 准则 (ITSEC) 、 加 拿 大 的 可 
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信 计 算 机 产品 评估 准则 (CTCPEC)、 美 国 的 信息 技术 安全 联邦 准则 (FC) 草 案 等 。 这 些 准 
则 比 TCSEC 更 加 灵活 ,适应 了 IT 技术 的 发 展 。 

为 满足 IT 互 认 标 准 化 安全 评估 结果 的 需要 ,解决 以 上 各 种 标准 、 准 则 中 概念 和 技术 
上 的 差异 ,CTCPEC、FC、TCSEC 和 ITSEC 的 发 起 组 织 于 1993 年 组 建 通用 准则 项 目 
(Common Criteria,CC) ,将 各 自 独 自 的 准则 集合 成 一 组 单一 的 、 能 被 行业 广泛 采用 的 IT 
安全 准则 。 项 目 发 起 组 织 的 代表 成 立 专门 的 委员 会 来 开发 通用 准则 。 历 经 多 次 讨论 与 修 
订 ,CC V2.1 版 于 1999 年 被 ISO( 国 际 标准 化 组 织 ) 采 用 为 国际 标准 ,2001 年 我 国 采 用 其 
为 国家 标准 。 

目前 ,CC 已 经 基本 取代 TCSEC ,成 为 评估 信息 产品 安全 性 的 主要 标准 。 

CC 的 文本 由 3 部 分 组 成 ,这 3 部 分 相互 依存 , 缺 一 不 可 。 

第 一 部 分 是 简介 和 一 般 模型 ,介绍 CC 中 的 术语 、 基 本 概念 一般 模型 以 及 评估 框架 。 

第 二 部 分 是 安全 功能 要 求 , 列 出 了 一 系列 类 (11 个 )、 子 类 (66 个 ) 和 组 件 (135 个 )。 

第 三 部 分 是 安全 保证 要 求 , 列 出 了 一 系列 保证 类 (7 个 )、 子 类 (26 个 ) 和 组 件 (74 个 )。 

CC 根据 系统 对 安全 保证 要 求 的 支持 情况 提出 了 评估 保证 等 级 (Evaluation 
Assurance Level,EAL) ,如 表 15. 2 所 示 , 从 EAL1 到 EAL7 共 分 为 7 级 ,保证 程度 逐渐 
提高 。 














表 15.2 CC 评估 保证 等 级 (EAL) 的 划分 











评估 定义 近似 于 TCSEC 
保证 等 级 安全 等 级 
EAL1 | 功能 测试 (functionally tested) 一 
EAL2 | 结构 测试 (structurally tested) 地 
EAL3 系统 地 测试 和 检查 (methodically tested and checked) C2 
EAL4 系统 地 设计 ,测试 和 复查 (methodically designed ,tested and reviewed) Bl 
EAL5 半 形 式 化 设计 和 测试 (semiformally designed and tested) B2 
EAL6 半 形 式 化 验证 的 设计 和 测试 (semiformally verified design and tested) B3 
EAL7 形式 化 验证 的 设计 和 测试 (formally verified design and tested) Al 


有 关 CC 的 具体 要 求 ,有 兴趣 的 读者 可 以 查阅 相关 标准 介绍 。 


15.2 数据 库 系统 安全 控制 


15.2.1 数据 库 系统 安全 模型 


在 数据 库 系 统 中 ,为 了 更 好 地 保护 数据 ,安全 措施 是 分 级 设置 的 。 

环境 级 : 数据 库 系统 的 机 房 和 设备 应 加 以 妥善 保护 ,防止 人 为 物理 破坏 。 

只 员 级 : 工作 人 员 应 具备 职业 操守 ,正确 授予 合法 用 户 访问 数据 库 的 权限 。 

操作 系统 级 : 应 防止 未 经 授权 的 用 户 从 操作 系统 处 绕 开 DBMS 访问 数据 库 。 

网 络 级 : 互联 网 发 达 的 时 代 , 大 多 数 数据 库 系统 都 允许 用 户 通过 网 络 进行 远程 访问 ， 
因此 网 络 内 部 的 安全 性 是 很 重要 的 。 





287 











数据 库 原理 及 应 用 


数据 库 系统 级 : 数据 库 系统 级 的 安全 措施 会 验证 用 户 的 身份 是 否 合法 ,使 用 数据 库 
的 权限 是 否 符合 授权 约定 。 

5 个 安全 措施 级 别 中 ,环境 级 和 职员 级 的 安全 性 问题 属于 法 律 法 规 、 社 会 道德 问题 ; 
操作 系统 的 安全 性 从 身份 验证 到 并 发 处 理 底层 的 控制 ,以 及 文件 系统 的 安全 都 属于 操作 
系统 内 容 。 网 络 级 的 安全 措施 属于 网 络 方 向 。 这 几 方 面 的 安全 措施 本 章节 均 不 讨论 。 

构建 起 的 数据 库 系统 安全 模型 如 图 15. 1 所 示 。 


< 
身 从 标识 和 此 别 上 = 一 |DBMS 安 全 保护 机 制 于 | os 安全 保护 机 制 


用 户 登 录 数据 加 密 
图 15.1 数据 库 系 统 安全 模型 




















在 安全 模型 中 ,用 户 要 求 进 入 数据 库 系统 时 ,系统 首先 根据 用 户 输入 的 用 户 标识 进行 
身份 鉴定 ,只 有 合法 用 户 才 可 以 进入 系统 ;对 于 进入 了 系统 的 合法 用 户 ,数据 库 管理 系统 
在 用 户 提 出 数据 请 求 时 ,会 进行 多 层 存 取 控制 ,通过 权限 检查 后 ,用 户 的 数据 请 求 才 会 被 
执行 ;内 模式 存储 层 读 取 物理 数据 时 ,操作 系统 会 有 自己 的 保护 措施 ;最 后 ,数据 的 存储 、 
网 络 传送 还 可 以 用 加 密 的 形式 存储 至 数据 库 或 者 传送 。 

本 章 讨 论 的 数据 库 系 统 安全 机 制 包括 用 户 身 份 鉴别 ,多 层 存 取 控 制 .审计 、 视 图 和 数 
据 加 密 等 。 


15.2.2 用 户 身 份 标识 与 鉴别 


用 户 身 份 标识 与 鉴别 是 数据 库 管理 系统 提供 的 数据 库 系 统 最 外 层 安 全 保护 措施 。 

每 个 合法 用 户 在 系统 内 部 都 有 一 个 用 户 标识 ,每 个 用 户 标识 由 用 户 名 和 用 户 标识 号 
(UID) 组 成 。UID 在 系统 的 整个 生命 周期 内 是 唯一 的 。 系 统 内 部 记录 着 所 有 合法 用 户 的 
标识 号 。 

系统 鉴别 是 指 由 系统 提供 一 定 的 方式 让 用 户 标识 自身 的 名 字 或 身份 。 每 次 用 户 要 求 
登录 系统 时 ,由 数据 库 管理 系统 安全 子 系统 进行 验证 ,通过 验证 的 用 户 才 提供 相应 使 用 数 
据 库 系统 的 权限 。 

例如 ,Oracle 允许 同一 用 户 3 次 登录 ,如 果 连 续 3 次 登录 密码 都 错误 , 则 锁 死 该 用 户 
标识 。 

对 用 户 进行 身份 鉴别 的 方法 有 很 多 种 ,在 一 个 实际 的 系统 中 ,往往 是 多 种 方法 结合 ， 
以 获得 更 强 的 安全 性 。 常 用 的 用 户 身份 鉴别 有 以 下 4 种 。 


1. 静态 口令 


静态 口令 鉴别 是 常用 的 鉴别 方法 。 静 态 口令 由 用 户 自己 设 定 ,鉴别 时 只 要 输入 的 口 
令 正 确 , 系 统 就 鉴别 通过 ,允许 用 户 使 用 数据 库 系 统 。 因 此 ,静态 口令 身份 鉴别 下 ,口令 的 
复杂 度 与 安全 对 数据 库 系统 的 登录 安全 十 分 关键 。 

在 此 基础 上 ,数据 库 管理 员 还 可 以 根据 应 用 需求 设置 口令 强度 。 例 如 , 设 定 的 口令 不 
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可 以 与 用 户 名 相同 .设置 重复 输入 口令 的 最 小 时 间 间 隔 等 。 
2. 动态 口令 


动态 口令 鉴别 是 目前 较为 安全 的 鉴别 方式 。 其 口令 是 动态 变化 的 ,每 次 鉴别 时 均 须 
使 用 动态 产生 的 新 口令 登录 数据 库 系统 ,也 就 是 一 次 一 密 。 常 用 的 方式 如 短信 密码 和 动 
态 令 牌 方式 ,每 次 鉴别 时 要 求 用 户 使 用 通过 短信 或 令 牌 等 途径 获取 的 新 口令 登录 数据 库 


3. 生物 特征 鉴别 


生物 特征 鉴别 是 一 种 通过 生物 特征 进行 身份 鉴别 的 技术 。 生 物 特 征 是 指 生物 体 唯一 
具有 的 ,可 测量 ,识别 和 验证 的 稳定 生物 特征 ,如 指纹 .虹膜 等 。 生 物 特 征 鉴别 采用 图 像 处 
理 和 模式 识别 等 技术 实现 基于 生物 特征 的 认证 ,与 传统 口令 鉴别 方式 相 比 ,安全 性 高 
很 多 。 


4. 智能 卡 


智能 卡 是 一 种 不 可 复制 的 硬件 ,内 置 集成 电路 芯片 ,具有 硬件 加 密 功 能 。 智 能 卡 由 
用 户 携带 ,登录 数据 库 系 统 时 ,用 户 将 智能 卡 插入 专门 的 读 卡 器 进行 身份 验证 。 由 于 
每 次 从 智能 卡 中 读 取 的 信息 是 静态 的 ,通过 内 存 扫描 或 者 网 络 监听 等 技术 是 可 能 截获 
用 户 的 智能 卡 身 份 验 证 信息 的 。 因 此 ,实际 应 用 中 一 般 采 用 个 人 身份 识别 码 (PIN) 和 
智能 卡 相 结合 的 方式 。 这 样 , 即 使 PIN 和 智能 卡 中 有 一 种 被 窃取 ,用 户 身 份 仍 不 会 被 
冒充 。 





15.2.3 存 取 控 制 概述 


存 取 控 制 机 制 主要 包括 两 部 分 : 定义 用 户 权限 ,并 将 用 户 权 限 登 记 到 数据 字典 中 。 

用 户 或 应 用 程序 使 用 数据 库 的 方式 称 为 权限 (authorization)。 权 限 的 分 类 在 第 
15. 3 节 介绍 。 在 数据 库 系统 中 对 用 户 或 应 用 程序 权限 的 定义 称 为 授权 。 这 些 授权 定义 
经 过 编译 后 存放 在 数据 字典 中 ,被 称 作 “安全 规则 ”或 “授权 规则 ”。 需 要 说 明 的 是 , 某 个 用 
户 应 该 具有 何 种 权限 是 管理 和 政策 的 问题 ,而 不 是 技术 问题 ,数据 库 管理 系统 要 提供 保证 
这 些 决 定 执 行 的 功能 ,也 就 是 权限 定义 功能 。 

合法 权限 检查 : 每 当 用 户 发 出 使 用 数据 库 的 操作 请 求 后 ,请 求 一 般 包 括 操作 类 型 、 操 
作对 象 和 操作 用 户 等 信息 ,数据 库 管 理 系统 查找 数据 字典 的 安全 性 定义 ,根据 安全 规则 进 
行 合法 权限 检查 , 若 用 户 的 操作 请 求 超出 定义 的 权限 ,系统 将 拒绝 执行 此 操作 。 

用 户 权限 定义 和 合法 权限 检查 机 制 一 起 组 成 了 DBMS 的 安全 子 系统 。 

C2 级 或 VAL3 级 的 数据 库 管 理 系 统 必须 支持 自主 存 取 控制 (Discretionary Access 
Control,DAC) ,Bl 级 或 VAL4 级 的 数据 库 管理 系统 必须 支持 强制 存 取 控制 (Mandatory 
Access Control,MAC) 。DAC 与 MAC 是 SQL 层 存 取 控 制 的 不 同 级 别 。 
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1. 自主 存 取 控 制 


在 自主 存 取 控制 机 制 中 ,用 户 对 不 同 的 数据 库 对 象 有 不 同 的 存 取 权限 ,不 同 的 用 户 对 
同一 对 象 也 有 不 同 的 权限 ,用 户 可 以 将 其 拥有 的 存 取 权限 转 授 给 其 他 用 户 , 因 此 自主 存 取 
控制 非常 灵活 。 


2. 强制 存 取 控 制 


在 强制 存 取 控制 机 制 中 ,每 个 数据 库 对 象 被 标 以 一 定 的 密级 ,每 个 用 户 也 被 授予 某 一 
个 级 别 的 许可 证 。 对 于 任意 一 个 对 象 , 只 有 具有 合法 许可 证 的 用 户 才 可 以 存 取 。 相 对 于 
DAC ,强制 存 取 控制 严格 一 些 。 


3. 多 级 存 取 控 制 


较 高 安全 性 级 别提 供 的 安全 保护 要 包含 较 低 级 别 的 所 有 保护 ,因此 ,在 实现 强制 存 取 
控制 时 要 首先 实现 自主 存 取 控 制 。 自 主 存 取 控制 与 强制 存 取 控 制 共同 构成 数据 库 管 理 系 
统 SQL 层 的 安全 机 制 。 系 统 首先 进行 自主 存 取 控制 检查 ,对 通过 自主 存 取 控 制 的 允许 存 
取 的 数据 对 象 再 进行 强制 存 取 控 制 检查 ,只 有 通过 强制 存 取 控 制 检查 的 数据 对 象 方 可 被 
用 户 存 取 。 


15.3 ”自主 存 取 控制 


大 型 数据 库 管理 系统 都 支持 自主 存 取 控制 ,SQL 标准 也 支持 自主 存 取 控制 。 自 主 存 
取 控 制 (DAC) 主 要 通过 SQL 的 GRANT 语句 和 REVOKE 语句 来 实现 。 

用 户 权限 由 两 个 要 素 组 成 : 数据 库 对 象 和 操作 类 型 。 定 义 一 个 用 户 的 存 取 权限 就 是 
要 定义 这 个 用 户 在 哪些 数据 库 对 象 上 可 以 进行 哪些 类 型 的 操作 。 在 数据 库 系统 中 ,定义 
存 取 权限 称 为 授权 。 

在 非 关 系数 据 库 系统 中 ,用 户 只 能 对 数据 进行 操作 , 存 取 控制 的 数据 库 对 象 仅 限于 数 
据 本 身 。 在 关系 数据 库 系统 中 , 存 取 控制 的 对 象 不 仅 有 数据 本 身 ( 如 基本 表 、 属 性 、 视 图 
等 ), 还 有 数据 库 模式 。 

有 具体 来 说 ,关系 数据 库 权 限 (authorization) (SQL2 标准 ) 有 下 列 几 种 。 

读 (read) : 允许 用 户 读数 据 , 但 不 能 修改 数据 。 

插入 (insert) : 允许 用 户 插 入 新 的 数据 。 

修改 (update) : 允许 用 户 修改 数据 。 

删除 (delete) : 允许 用 户 删 除数 据 。 

参照 (references) : 允许 用 户 引 用 其 他 关系 的 主键 作为 外 键 。 

除了 以 上 访问 数据 本 身 的 权限 ,关系 系统 还 提供 给 用 户 修改 数据 库 模式 的 权限 。 

Create: 允许 用 户 创建 新 的 数据 库 模式 ,关系 (TABLE)、 索 引 (INDEX)、 视 图 
(VIEW) 等 。 

Alter: 允许 用 户 修 改 已 有 的 数据 库 模 式 . 关 系 (TABLE)、 索 引 (CINDEX)、 视 图 
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(VIEW) 等 的 结构 。 
Drop: 允许 用 户 撤销 已 有 的 数据 库 模式 .关系 (TABLE)、 索 引 (INDEX)、 视 图 
(VIEW) 等 的 结构 。 


15.3.1 授权 


授权 有 两 层 意思 : 权限 授予 与 收回 。SQL 中 使 用 GRANT 和 REVOKE 语句 向 用 户 
授予 或 收回 对 数据 对 象 的 操作 权限 。GRANT 语句 向 用 户 授予 权限 ,REVOKE 语句 收回 
已 经 授予 给 用 户 的 权限 。 


1. GRANT 语句 
GRANT 语句 的 一 般 格式 : 


GRANT < 权限 > [,< 权 限 >]... 
ON < 对 象 类 型 > [,< 对 象 名 >] 
TO < 用 户 > [,< 用 户 >]... 
[WITH GRANT OPTION] ， 


该 语句 的 语义 如 下 : 将 指定 数据 对 象 的 指定 操作 权限 授予 指定 的 用 户 。 其 中 ,指定 
的 权限 类 型 在 GRANT 子 句 后 列 出 ,指定 的 对 象 在 ON 子 句 后 指定 。 一 个 GRANT 语句 
可 以 指定 多 个 数据 对 象 。ON 子 句 对 象 类 型 指定 授权 的 对 象 类 型 缺 省 字 , 关系 为 
TABLE, 视 图 为 VIEW 等 ;TO 子 句 指定 上 述 对 象 的 指定 权限 授予 哪些 用 户 。 一 个 
GRANT 语句 可 以 同时 对 多 个 用 户 ,甚至 全 部 用 户 (PUBLIC) 授 权 。 

如 果 指 定 了 WITH GRANT OPTION 子 句 , 则 获得 权限 的 用 户 可 以 把 这 种 权限 再 
授予 其 他 用 户 。SQL 允许 具有 WITH GRANT OPTION 的 用 户 把 相应 权限 授予 其 他 用 
户 , 但 不 允许 循环 授权 , 即 被 授权 者 不 能 把 权限 授 回 给 授权 者 或 授权 者 祖先 。 

最 后 需要 特别 说 明 的 是 ,不 是 所 有 用 户 都 可 以 随意 执行 GRANT 语句 。GRANT 语 
句 的 执行 者 可 以 是 数据 库 管理 员 , 也 可 以 是 该 数据 库 对 象 的 拥有 者 (owner) ,或 者 拥有 该 
权限 并 被 指定 了 WITH GRANT OPTION 子 句 的 用 户 。 

【 例 15.1】 将 查询 employee 表 的 权限 授 给 用 户 user]l 。 


GRANT SELECT 
ON TABLE employee 


TO userl; 


【 例 15.2】 将 对 employee 表 和 department 表 的 全 部 权限 授予 用 户 user2 和 user3。 


GRANT ALL PRIVILEGES 
ON TABLE employee, department 


TO user?2, user3; 


【 例 15.3】 将 对 表 project 的 查询 权限 授予 所 有 用 户 。 
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GRANT SELECT 
ON TABLE project 
TO PUBLIC; 


【 例 15.4】 将 查询 employee 表 和 修改 职员 职工 号 的 权限 授予 用 户 user4。 


GRANT UPDATE (ENO) ,SELECT 
ON TABLE employee 


TO user47 


这 里 实际 是 授予 user4 用 户 对 基本 表 employee 的 SELECT 权限 和 对 属性 列 ENO 


的 UPDATE 权限 。 对 属性 列 授权 必须 明确 指出 相应 的 属性 列 名 。 


【 例 15.5】 将 对 表 project 的 INSERT 权限 授予 user5 用 户 , 并 允许 他 再 将 此 权限 


授予 其 他 用 户 。 


GRANT INSERT 

ON TABLE project 
TO user5 

WITH GRANT OPTION; 


执行 例 15. 5 后 ,user5 不 仅 拥有 了 对 表 project 的 INSERT 权限 ,还 可 以 传播 此 


权限 。 
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2. REVOKE 语句 


授予 用 户 的 权限 可 以 由 数据 库 管理 员 或 者 其 他 授权 者 用 REVOKE 语句 收回 。 
REVOKE 语句 的 一 般 格式 : 
REVOKE < 权限 > [,< 权 限 >]… 


ON < 对 象 类 型 > [,< 对 象 名 >] 
FROM < 用 户 > [,< 用 户 >]… [CASCADE |RESTRICT]; 


【 例 15.6】 把 用 户 user4 修改 employee 表 职 员 职 工 号 的 权限 收回 。 


REVOKE UPDATE (ENO) 
ON TABLE employee 
FROM userd; 


【 例 15.7】 回收 所 有 用 户 对 表 project 的 查询 权限 。 


REVOKE SELECT 
ON TABLE project 
FROM PUBLIC; 


【 例 15.8】 把 用 户 user5 对 project 表 的 INSERT 权限 收回 。 


REVOKE INSERT 
ON TABLE project 
FROM user57 
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在 将 用 户 user5 的 INSERT 权限 收回 的 同时 ,系统 会 级 联 (CASCADE) 收 回 user6 和 
user7 的 INSERT 权限 (假设 user5 级 联 授予 了 user6 和 user7 权限 ) ,否则 系统 拒绝 
(RESTRICT) 执 行 REVOKE 命令 。 

SQL 提供 了 非常 灵活 的 授权 机 制 。 数 据 库 管理 员 拥 有 对 数据 库 中 所 有 对 象 的 所 有 
权限 ,根据 应 用 的 需要 将 不 同 的 权限 授予 不 同 的 用 户 。 用 户 对 自己 建立 的 数据 库 对 象 ,如 
基本 表 和 视图 ,拥有 全 部 的 操作 权限 ,并且 可 以 用 GRANT 语句 将 其 中 某 些 权限 授予 其 
他 用 户 。 被 授权 的 用 户 如 果 有 ”继续 授权 ”的 许可 (WITH GRANT OPTION) ,还 可 以 把 
获得 的 权限 再 授予 其 他 用 户 。 

所 有 授予 出 去 的 权限 在 必要 时 都 可 以 用 REVOKE 语句 收回 。 


15.3.2 角色 


角色 (Role) 是 被 命名 的 一 组 数据 库 权 限 的 集合 。 为 了 方便 权限 管理 ,可 以 为 具有 相 
同 权限 的 用 户 创建 一 个 管理 单位 ( 即 角色 )。 角 色 被 授予 某 个 用 户 ,用 户 就 继承 角色 上 的 
所 有 权限 。 例 如 ,同一 部 门 的 职员 ,很 多 数据 库 的 使 用 权限 是 相同 的 ,不 妨 将 这 些 权限 定 
义 一 个 部 门 权 限 角 色 ,每 个 职员 自动 获得 部 门 角色 的 所 有 权限 。 使 用 角色 来 管理 数据 库 
权限 可 以 简化 授权 过 程 。 

一 个 角色 包含 的 权限 包括 直接 授予 这 个 角色 的 全 部 权限 加 上 其 他 角色 授予 它 的 全 部 
权限 。 一 个 用 户 包含 的 权限 包括 直接 授予 该 用 户 的 权限 加 上 它 从 所 在 角色 处 继承 来 的 
角色 。 


1. 创建 角色 

在 SQL 中 创建 角色 的 语法 格式 为 

CREATE ROLE < 角色 名 > 

刚 创建 的 角色 权限 为 空 ,使 用 GRANT 语句 像 对 用 户 授权 一 样 为 角色 授权 。 
2. 给 角色 授权 


GRANT < 权限 > [,< 权 限 >]… 
ON < 对 象 类 型 > [,< 对 象 名 >] 
TO < 角色 > [< 角色 >]… 


3. 将 角色 授予 其 他 用 户 或 者 角色 


GRANT < 角色 1> [,< 角 色 2> ]… 

TO < 用 户 > [,< 角 色 3>]… 

[WITH ADMIN OPTION] 

GRANT 语句 把 角色 授予 用 户 或 者 另外 的 角色 。 授 予 者 或 者 是 角色 的 创建 者 ,或 者 
拥有 在 这 个 角色 上 的 ADMIN OPTION。 在 GRANT 语句 中 ,如 果 指 定 了 WITH 
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ADMIN OPTION 子 句 , 则 获得 角色 权限 的 角色 或 用 户 可 以 再 将 角色 权限 授予 其 他 角色 。 


4. 角色 权限 的 收回 


REVOKE < 权限 > [,< 权 限 >]… 
ON < 对 象 类 型 > [,< 对 象 名 >] 
FROM < 角色 > [< 角色 >]… 


使 用 REVOKE 语句 可 以 收回 角色 的 权限 ,从 而 修改 角色 拥有 的 权限 。REVOKE 动 


作 的 执行 者 或 者 是 角色 的 创建 者 ,或 者 拥有 在 这 个 角色 上 的 ADMIN OPTION。 


【 例 15.9】 创建 角色 rolel ,对 其 授予 employee ,department 表 的 查询 与 删除 权限 ， 


将 rolel 授予 用 户 user3 ,user4 和 user5 。 


创建 角色 rolel 
CREATE ROLE rolel; 
对 rolel 授予 employee、department 表 的 查询 与 删除 权限 。 


GRANT SELECT, DELETE 
ON TABLE employee, department 
TO rolel; 


将 rolel 授予 用 户 user3、user4 和 user5。 


GRANT rolel 


TO user3, user4, user5; 


用 户 user3、user4 和 user5 自动 集成 rolel 的 所 有 权限 , 即 获得 employee、department 


表 的 查询 与 删除 权限 。 


【 例 15.10】 修改 rolel 的 权限 。 


GRANT UPDATE 

ON TABLE employee 

TO rolel; 

角色 rolel 在 原来 的 基础 上 增加 了 employee 表 的 UPDATE 权限 。 
【 例 15.11】 数据 库 管理 员 将 rolel 在 user3 上 的 授权 一 次 收回 。 


REVOKE rolel 


FROM user3; 


总 之 ,数据 库 角 色 是 一 组 权限 的 集合 。 使 用 角色 来 管理 数据 库 权限 可 以 简化 授权 操 


作 , 使 自主 存 取 控制 更 加 灵活 方便。 


15.3.3 视图 机 制 
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SQL 中 有 两 个 机 制 提供 安全 性 : 一 是 授权 子 系统 , 它 允 许 拥有 权限 的 用 户 有 选择 地 、 


数据 库 安全 


动态 地 把 这 些 权 限 授 予 其 他 用 户 ; 二 是 视图 , 它 用 来 对 无 权限 用 户 屏蔽 相应 的 那 一 部 分 数 
据 , 从 而 自动 对 数据 提供 一 定 程 度 的 安全 保护 。 

视图 机 制 间 接地 实现 支持 存 取 谓词 的 用 户 权限 定义 。 例 如 , 某 部 门 A 的 peoplel 职 
员 只 能 检索 本 部 门 职员 的 信息 ,可 以 先 建 立 部 门 A 的 视图 A_employee, 然 后 在 视图 上 进 
一 步 定 义 存 取 权限 。 


15.4 审计 


为 了 使 数据 库 管理 系统 达到 一 定 的 安全 级 别 , 还 需要 在 其 他 方面 提供 相应 的 支持 。 
其 中 ,审计 (Audit) 功 能 是 数据 库 管理 系统 达到 C2( 或 EAL3) 以 上 安全 级 别 必 不 可 少 的 
一 项 指标 。 

前 面 提 到 的 用 户 身份 标识 与 鉴别 、 存 取 控 制 、 视 图 等 这 些 安全 策略 都 不 是 无 懈 可 击 
的 ,蓄意 破坏 、 恶 意 盗 窃 的 用 户 总 是 想方设法 打破 安全 防护 。 

审计 把 用 户 对 数据 库 的 所 有 操作 自动 记录 下 来 放 入 审计 日 志 (Audit Log) 中 。 数 据 
库 系统 管理 员 或 者 审计 员 可 以 利用 审计 跟踪 的 信息 , 重 现 导致 数据 库 现 有 状况 的 一 系列 
事件 , 找 出 非法 存 取 数据 库 数据 的 人 、 时 间 和 内 容 等 。 

跟踪 审计 (Audit Trail) 是 一 种 监视 措施 。 数 据 库 在 运行 中 ,数据 库 管 理 系 统 跟 踪 
用 户 对 一 些 敏感 性 数据 的 存 取 活动 ,跟踪 的 结果 记录 在 跟踪 审计 记录 文件 中 ,有 许多 
数据 库 管理 系统 的 跟踪 审计 记录 文件 与 系统 的 运行 日 志 结合 在 一 起 。 一 旦 发 现 有 窃 
取 数 据 的 企图 ,有 的 数据 库 管 理 系统 会 发 出 警报 信息 ,多 数 数据 库 管 理 系统 虽 无 警报 
功能 ,但 是 可 以 在 事后 根据 记录 进行 分 析 , 从 中 发 现 危 及 安全 的 行为 ,追究 责任 ,采取 
防范 措施 。 

跟踪 审计 由 数据 库 系 统管 理 员 或 者 审计 员 控 制 , 或 由 数据 的 属 主 控制 。 审 计 通 常 很 
费时 间 和 空间 ,所 以 DBMS 往往 都 将 其 作为 可 选 特征 ,数据 库 管理 员 根据 应 用 对 安全 性 
的 要 求 ,灵活 地 打开 或 关闭 审计 功能 。 审 计 一 般 主 要 用 于 安全 性 要 求 较 高 的 部 门 。 

跟踪 审计 的 记录 一 般 包 括 下 列 内 容 : 请 求 ( 源 文本 ) ,操作 类 型 (如 修改 、 查 询 等 )、 操 
作 终 端 标识 与 操作 者 标识 、 操 作 日 期 和 时 间 、 操 作 涉及 的 对 象 . 数 据 的 前 映像 和 后 映像 。 


15.4.1 审计 事件 


审计 事件 分 为 多 个 类 别 ,一般 有 如 下 4 种 。 

(1) 服务 器 事件 : 审计 数据 库 服 务 器 发 生 的 事件 ,包含 数据 库 服务 器 的 启动 .停止 ， 
数据 库 服务 器 配置 文件 的 重 载 。 

(2) 系统 权限 : 对 系统 拥有 的 结构 和 模式 对 象 进行 操作 的 审计 ,要 求 该 操作 的 权限 
是 通过 系统 权限 获得 的 。 

(3) 语句 事件 : 对 SQL 语句 (如 DDL、DML 及 DCL 语句 ) 的 审计 。 

(4) 模式 对 象 事件 : 对 特定 模式 对 象 上 进行 的 SELECT 或 DML 操作 的 审计 。 模 式 
对 象 包括 表 、 视 图 等 。 模 式 对 象 不 包括 依附 于 表 的 索引 、 约 束 、 触 发 器 等 。 
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15.4.2 审计 的 作用 


审计 有 以 下 两 方面 作用 。 

(1) 可 以 用 来 记录 所 有 数据 库 用 户 登 录 及 退出 数据 库 的 时 间 ,作为 记 账 收费 或 统计 
管理 的 依据 。 

(2) 可 以 用 来 监视 对 数据 库 的 一 些 特定 的 访问 ,及 任何 对 敏感 数据 的 存 取 情 况 。 

需要 说 明 的 是 ,审计 只 记录 对 数据 库 的 访问 活动 ,并 不 记录 具体 的 更 新 .插入 或 删除 
的 信息 内 容 , 这 与 日 志文 件 是 有 区 别 的 。 


15.5 强制 存 取 控 制 


自主 存 取 控制 机 制 由 用 户 自主 地 决定 将 数据 的 存 取 权限 授予 何人 ,以 及 是 否 将 该 授 
权 的 权限 授予 该 人 。 在 这 种 授权 机 制 下 , 仅 通 过 对 数据 的 存 取 权限 来 进行 安全 控制 ,对 数 
据 本 身 不 实施 安全 性 标记 ,很 容易 造成 数据 无 意 泄露 。 因 为 被 授权 的 用 户 可 以 将 数据 进 
行 备份 ,获得 自身 权限 内 的 副本 ,并 自由 传播 。 

本 节 介绍 的 强制 存 取 控 制 就 能 解决 上 述 问题 。 

在 强制 存 取 控制 中 ,数据库 系统 中 的 全 部 实体 被 分 为 主体 和 客体 两 类 。 主 体 是 系统 
中 的 活动 实体 , 既 包 括 数 据 库 管理 系统 管理 的 实际 用 户 ,也 包括 代表 用 户 的 进程 。 客 体 是 
系统 中 的 被 动 实体 , 受 主体 操纵 ,包括 数据 文件 .基本 表 、 索 引 、 视 图 等 。 对 于 主体 和 客体 ， 
数据 库 管 理 系统 为 它们 指派 一 个 敏感 度 标记 。 

敏感 度 标 记分 为 若干 级 别 , 从 高 到 低 有 绝密 (Top Secret,TS) ,机 密 (Secret,S) ,可 信 
(Confidential,C)、 公 开 (Public,P)。 主 体 的 敏感 度 标 记 称 为 许可 证 级 别 (Clearance 
Level) ,客体 的 敏感 度 标记 称 为 密级 (Classification Level) 。 

强制 存 取 控 制 就 是 通过 比 对 主体 的 敏感 度 标记 和 客体 的 敏感 度 标记 ,最 终 确定 主体 
是 否 能 够 存 取 客体 。 

当 某 一 用 户 或 主体 以 标记 label 登录 系统 ,该 用 户 或 主体 对 客体 的 存 取 就 遵循 如 下 
规则 。 

(1) 仅 当 主体 的 许可 证 级 别 大 于 或 等 于 客体 的 密级 时 ,该 主体 才能 读 取 相 应 的 客体 。 

(2) 仅 当 主体 的 许可 证 级 别 小 于 或 等 于 客体 的 密级 时 ,该 主体 才能 写 取 相应 的 客体 。 
例如 ,Oracle 的 规则 2 规定 , 仅 当 主体 的 许可 证 级 别 等 于 客体 的 密级 时 ,该 主体 才能 写 取 
相应 的 客体 ,也 就 是 Oracle 中 的 主体 只 能 修改 与 其 同 级 的 数据 。 

对 于 规则 2, 主 体 可 以 将 他 写 人 的 数据 对 象 赋予 高 于 自身 许可 证 级 别 的 密级 ,这 样 一 
且 数 据 被 写 人 ,该 主体 自己 也 不 能 再 读 该 数据 对 象 了 。 

强制 存 取 控 制 对 数据 本 身 进行 密级 标记 ,无 论 数 据 如 何 复制 ,标记 与 数据 都 是 一 个 密 
不 可 分 的 整体 ,只 有 符合 密级 标记 要 求 的 用 户 才 可 以 操纵 数据 ,从 而 提供 更 高 级 别 的 安 
全 性 。 
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15.6 数据 加 密 


为 了 更 好 地 保证 数据 库 的 安全 性 ,可 以 使 用 数据 加 密 技术 加 密 存 储 口 令 和 数据 ,数据 
传输 采用 加 密 传输 。 数 据 加 密 是 防止 数据 库 数据 一 一 尤其 对 于 高 度 敏感 数据 一 一 在 存储 
和 传输 中 泄密 的 有 效 手段 。 在 数据 加 密 技 术 中 ,原始 数据 称 为 明文 (Plain Text) ,加 密 的 
基本 思想 是 根据 一 定 的 算法 将 明文 变换 为 不 可 直接 识别 的 密 文 (Cipher Text) ,从 而 使 得 
不 知道 解密 算法 的 人 无 法 获知 数据 的 内 容 。 





15.6.1 加 密 技术 


加 密 数据 的 技术 举 不 胜 举 。 好 的 加 密 技 术 具 有 如 下 性 质 。 

对 于 授权 用 户 , 加 密 数据 和 解密 数据 相对 简单 。 

加 密 模 式 不 应 依赖 于 算法 的 保密 ,而 应 依赖 于 被 称 作 加 密 密 钥 的 算法 参数 ,该 密 钥 用 
于 加 密 数 据 。 

对 入 侵 者 来 说 ,即使 已 经 获得 了 加 密 数据 的 访问 权限 ,确定 解密 密 钥 仍 是 极其 困 
难 的 。 

对 称 密 钥 加 密 和 公 钥 加 密 是 两 种 相对 立 但 应 用 广泛 的 加 密 方法 。 


15.6.2 数据 库 中 的 加 密 支 持 


数据 库 加 密 主要 包括 存储 加 密 和 传输 加 密 。 
1. 存储 加 密 


对 于 存储 加 密 , 一 般 提供 透明 和 非 透明 两 种 存储 加 密 方式 。 透 明 存 储 加密 是 内 核 级 
加 密 保 护 方式 ,对 用 户 完 全 透明 ; 非 透明 存储 加 密 则 是 通过 多 个 加 密 函 数 实现 的 。 


2. 传输 加 密 


在 网 络 传输 中 ,数据 库 用户 与 服务 器 之 间 若 采用 明文 方式 传输 数据 ,容易 被 网 络 恶 
意 用 户 截获 或 自 改 ,存在 安全 隐患 。 因 此 ,数据库 管理 系统 提供 了 传输 加 密 功 能 ,系统 
将 数据 发 送 到 数据 库 之 前 对 其 加 密 ,应 用 程序 必须 在 将 数据 发 送 给 数据 库 之 前 对 其 加 
密 , 并 当 获 取 到 数据 时 对 其 解密 。 这 种 数据 加 密 方法 需要 对 应 用 程序 进行 大 量 的 
修改 。 

数据 库 加 密使 用 已 有 的 加 密 技术 和 算法 对 数据 库 中 存储 的 数据 和 传输 的 数据 进行 保 
护 。 即 使 攻击 者 获取 数据 源 文件 ( 即 密 文 ) ,也 很 难 解密 得 到 原始 数据 ( 即 明 文 ) 。 

但 是 ,数据 库 加 密会 增加 查询 处 理 的 复杂 度 , 查 询 效 率 会 受 影响 。 加 密 数 据 的 密 钥 的 
管理 和 数据 加 密 对 应 用 程序 的 影响 也 是 数据 加 密 过 程 中 需要 考虑 的 问题 。 
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15.7 更 高 安全 性 保护 


除 自主 存 取 控制 强制 控制 外 ,为 了 满足 更 高 安全 等 级 的 数据 库 系 统 的 安全 性 要 求 ， 
还 有 推理 控制 .隐蔽 信道 和 数据 隐私 保护 技术 。 有 兴趣 的 读者 可 以 查阅 相关 书籍 。 

万 无 一 失地 保证 数据 库 安 全 几乎 是 不 可 能 的 。 但 高 度 的 安全 措施 可 以 使 攻击 者 付出 
高 昂 的 代价 ,从 而 迫使 攻击 者 不 得 不 放弃 破坏 。 


15.8 小 结 


数据 库 安全 性 是 数据 库 管理 系统 的 基本 功能 之 一 。 随 着 数据 库 应 用 的 深入 ,大 数据 
时 代 来 临 ,数据 的 共享 安全 、 隐 私 保护 显得 日 益 重要 。 

数据 库 的 安全 性 是 指 保护 数据 库 , 防 止 不 合法 使 用 造成 数据 泄密 、 更 改 或 者 破坏 。 数 
据 库 管理 系统 自身 有 一 套 完整 而 有 效 的 安全 性 机 制 。 

数据 库 管理 系统 提供 的 安全 措施 主要 包括 用 户 身份 标识 与 鉴别 ,多 级 存 取 控制 ,视图 
技术 审计 技术 以 及 数据 加 密 等 。 

用 户 身 份 标识 与 鉴别 是 数据 库 管理 系统 提供 的 数据 库 系 统 最 外 层 安全 保护 措施 。 常 
见 的 用 户 身份 鉴别 方法 有 静态 口令 .动态 口令 ,生物 特 征 鉴 别 、 智 能 卡 等 。 

多 级 存 取 控制 从 低 到 高 分 为 自主 存 取 控制 ,强制 存 取 控制 和 推理 控制 。 高 安全 性 级 
别提 供 的 安全 保护 要 包含 较 低级 别 的 所 有 保护 。 自 主 存 取 控制 (DAC) 指 用 户 对 不 同 的 
数据 库 对 象 有 不 同 的 存 取 权限 ,不 同 的 用 户 对 同一 对 象 也 有 不 同 的 权限 ,用户 可 以 将 其 拥 
有 的 存 取 权限 转 授 给 其 他 用 户 。 强 制 存 取 控 制 ( MAC) 指 每 个 数据 库 对 象 被 标 以 一 定 的 
密级 ,每 个 用 户 也 被 授予 某 一 个 级 别 的 许可 证 。 对 于 任意 一 个 对 象 ,只 有 具有 合法 许可 证 
的 用 户 才 可 以 存 取 。 

视图 对 无 权限 用 户 屏蔽 相应 数据 ,从 而 自动 对 数据 提供 一 定 程度 的 安全 保护 。 

审计 把 用 户 对 数据 库 的 所 有 操作 自动 记录 下 来 放 入 审计 日 志 (Audit Log) 中 。 数 据 
库 系 统管 理 员 或 者 审计 员 可 以 利用 审计 发 现 危 及 安全 的 行为 ,采取 防范 措施 。 

数据 加 密 是 根据 一 定 的 算法 将 明文 变换 为 密 文 ,不 知道 解密 算法 的 人 无 法 获知 数据 
的 内 容 。 为 了 更 好 地 保证 数据 安全 性 ,可 以 使 用 数据 加 密 技 术 加 密 存 储 口令 和 数据 ,数据 
传输 采用 加 密 传输 。 














15.9 习题 


. 什么 是 数据 库 安 全 性 ? 

. 简 述 TCSEC/TDI 和 CC 安全 级 别 如 何 划分 。 

. 什么 是 数据 库 的 自主 存 取 控制 ? 

. 什么 是 数据 库 的 强制 存 取 控制 ? 

.解释 强制 存 取 控制 中 主体 、 客 体 、 敏 感度 标记 的 含义 。 


an 上 性 
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第 16 章 ”数据库 恢 复 


数据 库 恢 复 (recovery) 指 数据 库 管理 系统 具有 能 把 数据 库 从 被 破坏 、 不 正确 的 状态 
恢复 到 最 近 一 个 正确 状态 的 能 力 。 

恢复 子 系统 是 数据 库 管理 系统 的 一 个 重要 组 成 部 分 ,而 且 还 相当 庞大 ,常常 占 整个 系 
统 代 码 的 十 分 之 一 以 上 。 数 据 库 系统 采用 的 恢复 技术 是 否 行 之 有 效 ,不仅 对 系统 的 可 靠 
程度 起 着 决定 性 作用 ,也 是 衡量 数据 库 系统 性 能 的 重要 指标 。 


16.1 故障 类 型 
系统 可 能 发 生 各 种 各 样 的 故障 ,大 致 分 为 以 下 3 类 。 
16.1.1 事务 故障 


事务 故障 意味 着 事务 没有 达到 预期 的 终点 COMMIT 或 者 显 式 的 ROLLBACK, 因 
此 ,事务 可 能 处 于 不 正确 的 状态 。 

造成 事务 执行 失败 的 错误 有 好 辑 错 误 和 系统 错误 。 

逻辑 错误 指 事务 由 于 某 些 内 部 条 件 无 法 继续 正常 执行 ,例如 非法 输入 ` 溢 出 或 者 超出 
资源 限制 。 

系统 错误 指 系统 进入 一 种 不 良 状 态 , 如 死 锁 ,结果 事务 无 法 继续 正常 执行 。 但 是 ,该 
事务 可 以 在 以 后 的 某 个 时 间 重 新 执行 。 


16.1.2 系统 故障 


系统 故障 也 称 为 系统 崩溃 (system crash) , 指 软件 、 硬 件 故障 或 者 操作 系统 的 漏洞 , 导 
致 易 失 性 存储 器 (如 内 存 ) 内 容 丢 失 , 运 行 其 上 的 所 有 事务 非 正常 停止 。 系 统 故 障 常 称 为 
软 故障 (soft crash) 。 


16.1.3 介质 故障 


介质 故障 (media failure) 也 称 为 硬 故 障 (hard failure) 或 者 磁盘 故障 (disk failure) , 指 
非 易 失 性 存储 器 故障 ( 即 外 存 故 障 ) ,如 磁盘 损坏 、 磁 头 碰撞 、 瞬 时 强 磁场 干扰 等 。 这 类 故 
障 将 破坏 数据 库 或 部 分 数据 库 , 并 影响 正在 存 取 这 部 分 数据 的 所 有 事务 。 这 类 故障 比 前 
两 类 故障 发 生 的 可 能 性 小 得 多 ,但 是 破坏 性 很 大 。 

要 将 数据 库 系统 从 故障 中 恢复 ,首先 需要 确定 用 于 存储 数据 的 设备 的 故障 方式 ,然后 
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确定 这 些 故障 对 数据 库 的 数据 有 什么 影响 ,最 后 确定 故障 发 生 后 仍然 保证 数据 库 一 致 性 
以 及 事务 的 原子 性 的 算法 。 这 些 算法 称 为 恢复 算法 ,由 两 部 分 组 成 : 在 正常 事务 处 理 时 
采取 措施 ,保证 有 足够 的 信息 可 用 于 故障 恢复 ;在 故障 发 生 后 采取 措施 ,将 数据 库 内 容 恢 
复 到 某 个 保证 数据 库 一 致 性 、 事 务 原子 性 以 及 持久 性 的 状态 。 


16.2 恢复 的 基本 原理 与 实现 方法 


恢复 技术 的 基本 原理 很 简单 ,就 是 建立 “元 余 ”, 即 数据 库 的 重复 存储 。 
基本 的 实现 方法 如 下 。 


1. 平时 做 好 两 件 事情 : 转 储 和 建立 日 志 


周期 性 地 (如 一 天 一 次 ) 对 整个 数据 库 进行 复制 , 转 储 到 另 一 个 磁盘 或 者 磁带 类 存储 
介质 中 ;建立 日 志 数 据 库 。 记 录 事 务 的 开始 、 结 束 标志 ,记录 事务 对 数据 库 的 每 次 插入 、 删 
除 和 修改 前 后 的 值 , 写 到 日 志 中 ,以 便 有 案 可 查 。 


2. 一 旦 发 生 数 据 库 故障 ,分 两 种 情况 进行 处 理 


(1) 如 果 数 据 库 被 破坏 ,如 磁头 脱落 、 磁 盘 损坏 等 ,数据 库 就 不 能 正常 运行 。 这 时 装 
入 最 近 一 次 复制 的 数据 库 备 份 到 新 的 磁盘 ,然后 利用 日 志 将 这 两 个 数据 库 状 态 之 间 的 所 
有 成 功 更 新 重 做 (REDO) 一 人 遍 , 这 样 既 恢复 了 原 有 的 数据 库 , 又 没有 丢失 对 数据 库 的 更 新 
操作 。 

(2) 如 果 数 据 库 没 有 被 破坏 ,但 是 有 些 数据 已 经 不 可 靠 , 受 到 质疑 ,例如 程序 在 批 处 
理 修改 数据 库 时 异常 中 断 ,这 时 不 必 去 复制 存档 的 数据 库 , 只 要 通过 日 志 执 行 撤 销 处 理 
(UNDO) ,撤销 所 有 不 可 靠 的 修改 ,把 数据 库 恢复 到 正确 的 状态 即 可 。 

日 志 恢 复 的 原理 很 简单 ,实现 的 方法 也 很 清晰 ,但 是 实现 技术 相当 复杂 。 


16.3 恢复 技术 


恢复 机 制 的 两 个 关键 问题 是 建立 宛 余 数据 ,利用 宛 余数 据 实现 恢复 。 
建立 元 余数 据 包括 数据 转 储 数据 库 本 身 和 建立 日 志 。 


16.3.1 数据 转 储 

数据 转 储 是 指数 据 库 管理 员 将 整个 数据 库 复制 到 磁带 或 另 一 个 磁盘 上 保存 起 来 的 过 
程 。 这 些 备 用 的 数据 文本 称 为 后 备 副本 或 后 援 副本 。 

1. 静态 转 储 与 动态 转 储 


静态 转 储 指 在 系统 中 无 事务 运行 时 进行 转 储 , 转 储 开 始 时 数据 库 处 于 一 致 性 状态 , 转 
储 期 间 不 允许 对 数据 库 的 任何 数据 进行 修改 活动 。 静 态 存储 实现 简单 ,但 是 不 允许 事务 
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在 转 储 过 程 中 修改 数据 库 , 极 大 地 降低 了 数据 库 的 可 用 性 。 转 储 必须 等 用 户 事务 结束 ,而 
新 的 事务 必须 等 转 储 结束 才能 开始 。 

动态 转 储 指 转 储 操作 与 用 户 事务 并 发 进行 , 转 储 期 间 允 许 对 数据 库 进行 数据 修改 。 
动态 转 储 不 用 等 待 正 在 运行 的 用 户 事务 结束 ,不 会 影响 新 事务 的 运行 ;但 是 , 正 因为 不 需 
切断 用 户 连接 ,数据 操作 与 转 储 同时 进行 ,所 以 动态 转 储 不 能 保证 副本 中 的 数据 正确 、 
有 效 。 

利用 动态 转 储 得 到 的 副本 进行 故障 恢复 ,需要 把 动态 转 储 期 间 各 事务 对 数据 库 的 修 
改 活动 登记 下 来 ,建立 日 志文 件 。 后 备 副本 加 上 日 志文 件 才能 把 数据 库 恢复 到 某 一 时 刻 
的 正确 状态 。 





2. 海量 转 储 与 增 量 转 储 


海量 转 储 指 每 次 转 储 全 部 数据 库 , 很 多 数据 库 产 品 称 其 为 完整 备份 。 

增 量 转 储 只 转 储 上 次 转 储 后 更 新 过 的 数据 。 

从 恢复 角度 看 ,使 用 海量 转 储 得 到 的 后 备 副本 进行 恢复 一 般 更 方便 ,但 如 果 数 据 库 很 
大 ,事务 处 理 又 十 分 频繁 , 则 增 量 转 储 方式 更 实用 .更 有 效 。 


3. 转 储 方法 小 结 


转 储 方式 有 海量 转 储 与 增 量 转 储 两 种 ,分 别 可 以 在 静态 与 动态 两 种 状态 下 进行 ,因此 
转 储 方法 分 类 如 表 16. 1 所 示 。 


表 16.1 转 储 方法 分 类 














转 储 状态 
转 储 方式 
动态 转 储 静态 转 储 
海量 转 储 动态 海量 转 储 静态 海量 转 储 
增 量 转 储 动态 增 量 转 储 静态 增 量 转 储 


一 般 地 ,应 定期 进行 数据 转 储 , 制 作 后 备 副 本 。 但 是 , 转 储 十 分 耗费 时 间 与 资源 ,不 能 
频繁 进行 。 数 据 库 管理 员 应 该 根据 数据 库 系统 的 实际 情况 确定 适当 的 转 储 策略 。 

例如 ,每 天 晚上 进行 动态 增 量 转 储 , 每 周 进行 一 次 动态 海量 转 储 , 每 月 进行 一 次 静态 
海量 转 储 。 


16.3.2 日 志文 件 格式 

日 志文 件 (log) 是 用 来 记录 事务 对 数据 库 的 更 新 操作 的 文件 。 也 可 以 说 ,日 志文 件 是 
日 志 记录 的 序列 ,记录 着 数据 库 中 的 所 有 更 新 活动 。 

1. 日 志文 件 登记 的 信息 


各 个 事务 的 开始 标记 (BEGIN TRANSACTION) 。 
各 个 事务 的 结束 标记 CCOMMIT 或 ROLLBACK ) 。 
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各 个 事务 的 所 有 更 新 操作 。 
与 事务 有 关 的 内 部 更 新 操作 。 
不 同 数据 库 系统 采用 的 日 志文 件 格式 并 不 完全 一 样 。 概 括 起 来 ,日 志文 件 主要 有 两 





种 格式 : 以 记录 为 单位 的 日 志文 件 和 以 数据 块 为 单位 的 日 志文 件 。 


2. 基于 记录 的 日 志文 件 中 的 一 个 日 志 记录 (log record) 需 要 登记 的 信息 


事务 标识 (标明 是 哪个 事务 ) 。 

操作 类 型 ( 插 和 人 、 删 除 或 修改 ) 。 

操作 对 象 (记录 内 部 标识 ) 。 

更 新 前 数据 的 旧 值 (对 插入 操作 而 言 ,此 项 为 空 值 ) 。 
更 新 后 数据 的 新 值 ( 对 删除 操作 而 言 ,此 项 为 空 值 ) 。 


3. 基于 数据 块 的 日 志文 件 中 的 一 个 日 志 记录 需要 登记 的 信息 


事务 标识 (标明 是 哪个 事务 ) 。 

被 更 新 的 数据 块 号 。 

更 新 前 数据 所 在 的 整个 数据 块 的 值 (对 插入 操作 而 言 , 此 项 为 空 值 )。 

更 新 后 整个 数据 块 的 值 ( 对 删除 操作 而 言 ,此 项 为 空 值 ) 。 

为 了 从 系统 故障 和 介质 故障 中 恢复 时 能 使 用 日 志 记 录 , 日 志 必 须 存 放 在 稳定 存储 器 


。 一 般 地 ,每 个 日 志 记录 创建 后 立即 写 人 稳定 存储 器 中 的 日 志文 件 尾部 。 


4. 日 志 记录 标记 


为 了 方便 ,日 志 记录 简 记 如 下 。 
更 新 日 志 记 录 表 示 为 <T;,X;,Vi,Vs, 表 示 事 务 T; 对 数据 项 X, 执行 了 一 个 写 操 


作 , 写 操作 前 X; 的 值 是 Vi , 写 操作 后 X; 的 值 是 V: 。 


类 似 地 ,有 二 T; start> ,表示 事务 Ti 开始 。 
二 T,; commit 二 ,表示 事务 T; 提交 。 
<T; abort> ,表示 事务 Ti 中 止 。 


16.3.3 日 志 登记 原则 


1. 日 志 登记 原则 概述 


为 保证 数据 库 是 可 恢复 的 ,登记 日 志文 件 时 必须 遵循 两 个 原则 。 

(1) 登记 的 次 序 为 并 行事 务 执行 的 时 间 次 序 。 

(2) 必须 先 写 日 志文 件 , 后 写 数据 库 。 

数据 的 修改 写 到 数据 库 中 和 对 应 这 个 修改 的 日 志 记录 是 两 个 不 同 的 操作 。 写 日 志文 


件 操作 指 把 对 应 数据 修改 的 日 志 记录 写 到 日 志文 件 中 。 写 数据 库 操作 指 把 对 数据 的 修改 
写 到 数据 库 中 。 
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2. 日 志 技术 下 的 事务 提交 


当 一 个 事务 的 COMMIT 日 志 记 录 输 出 到 稳定 存储 器 后 ,这 个 事务 就 提交 了 。 
COMMIT 日 志 记录 是 事务 的 最 后 一 个 日 志 记录 ,这 时 所 有 更 早 的 日 志 记录 都 已 经 输出 
到 稳定 存储 器 。 日 志 中 有 足够 的 信息 来 保证 ,即使 发 生 系统 崩溃 ,事务 所 做 的 更 新 也 可 以 
重 做 。 

如 果 系 统 骨 省 发 生 在 日 志 记 录 二 Ti commit 二 输出 到 稳定 存储 器 之 前 ,事务 T; 将 回 
深 。 这 样 ,包含 COMMIT 日 志 记 录 的 块 的 输出 是 单个 原子 动作 , 它 导致 一 个 事务 的 
提交 。 

在 原理 上 ,要 求 事务 提交 时 ,包含 该 事务 修改 的 数据 块 的 块 输出 到 稳定 存储 器 。 但 对 
于 大 多 数 基于 日 志 的 恢复 技术 ,这 个 输出 可 以 延迟 到 某 个 时 间 再 输出 。 


16.3.4 使 用 日 志 重 做 和 撤销 事务 


本 节 分 析 系统 如 何 利用 日 志 从 系统 崩溃 中 进行 恢复 以 及 正常 操作 中 对 事务 的 回 滚 。 
【 例 16.1】 考虑 简化 的 银行 转账 事务 ,事务 Tu 从 A 账户 转账 50 元 到 账户 B,A 账 
户 初始 值 为 1000,B 账户 初始 值 为 2000 ,事务 序列 如 下 : 


To :read (A); 
A:=A- 50; 
Write (A); 
Read (B); 
B:=B+ 50; 
Write (B); 


事务 T 从 账户 C 中 取出 100 元 ,C 账户 初始 值 为 700, 事 务 序列 如 下 : 
Ti :read (C); 


C:=C- 100; 
Write (C); 


日 志文 件 中 与 Tu 和 Ti 相关 的 部 分 如 图 16. 3 所 示 。 

图 16.1 是 可 串 行 化 调度 中 的 一 个 可 能 的 调度 。 事 
务 Tu 和 事务 T 的 执行 结果 ,对 于 数据 库 和 日 志文 件 都 
完成 了 实际 的 到 稳定 存储 器 的 输出 。 

利用 日 志 , 只 要 存储 日 志 的 非 易 失 性 存储 器 不 发 生 
故障 ,系统 就 可 以 对 任何 故障 实现 恢复 。 恢 复 子 系统 使 
用 两 个 恢复 过 程 redo 和 undo 来 完成 恢复 操作 。 这 两 个 
过 程 都 利用 日 志 查 找 更 新 过 的 数据 项 的 集合 ,以 及 它们 
各 自 的 旧 值 和 新 值 。 图 16.1 日 志文 件 中 与 T。 和 并 

redo(T) : 将 事务 了 更 新 过 的 所 有 数据 项 的 值 都 设 相关 的 部 分 





<To start> 
<To, A, 1000, 950> 
<To, B, 2000，2050> 


<To commit> 

















<T start> 





<TI, C, 700, 600> 











<T commit> 
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置 成 新 值 。 

redo 执行 更 新 的 顺序 是 非常 重要 的 。 当 从 系统 崩溃 中 恢复 时 ,如 果 对 某 数据 项 的 多 
个 更 新 的 执行 顺序 不 同 于 原来 的 执行 顺序 ,那么 该 数据 项 的 最 终 状 态 将 是 一 个 错误 的 值 。 
大 多 数 的 恢复 算法 都 不 会 把 每 个 事务 的 重 做 分 别 执行 ,而 是 对 日 志 进 行 一 次 扫描 ,在 扫描 
过 程 中 每 遇 到 一 个 需要 redo 的 日 志 记 录 , 就 执行 redo 动作 。 这 种 方法 能 确保 保持 执行 
时 的 更 新 顺序 ,并 且 效 率 更 高 ,因为 仅仅 需要 整体 读 一 遍 日 志 , 而 不 是 对 每 个 事务 读 一 遍 
日 志 。 

undo(T): 将 事务 工 更 新 过 的 所 有 数据 项 的 值 都 恢复 成 旧 值 。 

undo 操作 不 仅 将 数据 项 恢复 成 它 的 旧 值 ,而 且 作 为 撤销 过 程 的 一 部 分 ,还 写 日 志 记 
录 来 记 下 执行 的 更 新 。 这 些 日 志 记 录 是 特殊 的 redo-only 日 志 记 录 。 与 redo 过 程 一 样 ， 
执行 更 新 的 顺序 仍 是 非常 重要 的 。 完 成 对 事务 了 的 undo 操作 后 ,undo 过 程 往日 志 中 写 
一 个 二 T abort> 记 录 , 表 明 撤 销 完 成 了 。 对 于 每 个 事务 ,undoCT) 只 执行 一 次 ,如 果 在 正 
常 的 处 理 中 该 事务 回 滚 ,或 者 在 系统 崩溃 后 的 恢复 中 既 没有 发 现 事务 T 的 commit 记录 ， 
也 没有 发 现 事务 了 的 abort 记录 。 日 志文 件 中 ,每 个 事务 最 终 或 者 有 一 条 commit 记录 ， 
或 者 有 一 条 abort 记录 。 

发 生 系统 崩溃 后 ,系统 查阅 日 志 确定 为 了 保持 原子 性 ,哪些 事务 需要 重 做 ,哪些 事务 
需要 撤销 : 如 果 日 志 只 有 过 Ti start 过 记录, 既 没有 过 Ti commit 二 ,也 没有 二 T abort 之 ， 
事务 T; 就 需要 撤销 ;如 果 日 志 有 三 T; start 二 记录 ,以 及 二 Ti commit 二 记录 或 者 一 人 
abort 二 记录 ,事务 T; 需要 重 做 ;如 果 日 志 包 括 二 T; abort> 还 要 重 做 对 应 的 事务 T ,是 因 
为 在 日 志 中 有 二 T; abort 二 记录 的 事务 ,日 志 中 会 有 undo 操作 写 的 那些 redo-only 日 志 记 
录 。 在 这 种 情况 下 ,最 终结 果 是 对 所 做 的 修改 进行 撤销 。 

回 到 本 节 开 始 的 简化 银行 事务 示例 16. 1 ,事务 T 和 T 按照 先 Tu 后 T 的 顺序 执 
行 。 假 定 在 事务 完成 之 前 系统 崩溃 , 则 考虑 3 种 情形 ,如 图 16. 2 所 示 。 

<T, start> <7, start> <T, start> 
<7Th, A, 1000，950> <Th, A, 1000, 950> | <7To，A，1000，950> 
<7,, B, 2000, 2050> | <7,, B, 2000, 2050> | <T,, B, 2000，2050> 
<T, commit> <7T commit> 
<T, start> <T, start> 
< 九 ，C，700，600> < 九 ，C，700，600> 
<T commit> 
a b C 


图 16.2 例 16.1 系统 崩溃 的 3 种 情形 


情况 a, 假 定 崩溃 发 生 在 事务 Tu 的 write(B) 步 又 已 经 写 到 稳定 存储 器 之 后 , 当 重 新 
启动 时 ,系统 查找 日 志 , 对 于 事务 Tu, 只 有 二 Tu start 二 记录 ,但 是 没有 所 Tu commit 之 和 
二 T, abort 二 记录 。 事 务 T。 必须 撤销 ,执行 undo(T。)。 恢 复 结 果 是 : 存储 器 上 账户 A 
和 账户 B 的 值 分 别 为 1000 和 2000。 

情况 b, 假 定 前 溃 发 生 在 事务 Ti 的 write(C) 步 又 已 经 写 到 稳定 存储 器 之 后 , 当 重 新 
启动 时 ,系统 查找 日 志 , 对 于 事务 T,, 既 有 二 To。 start 请 记录 ,又 有 二 To。 commit 户 记录。 
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事务 Te 必须 重 做 ,执行 redo(T。)。 对 于 事务 T ,只 有 所 Ti start 之 记录 ,但 是 没有 到 亿 
commit 之 和 过 Ti abort> 记 录 。 事 务 T, 必须 撤销 ,执行 undo(T,)。 整 个 恢复 过 程 结束 
时 ,存储 器 上 账户 A、B 和 C 的 值 分 别 为 950、2050 和 700。 

情况 c, 假 定 崩溃 发 生 在 事务 T 的 日 志 记 录 二 T commit 过 已 经 写 到 稳定 存储 器 之 
后 , 当 重新 启动 时 ,系统 查找 日 志 , 事 务 Tu 在 日 志 中 既 有 二 T。 start 之 记录 ,又 有 二 T。 
commit 之 记录 。 对 于 事务 T ,在 日 志 中 也 既 有 二 Tu start 二 记录 ,也 有 二 Tu commit 之 记 
录 。 事 务 Tu 和 T 都 需要 重 做 。 在 系统 执行 redo(To) 和 redo(T, ) 过 程 后 ,存储 器 上 账户 
A.B 和 C 的 值 分 别 为 950.2050 和 600。 





16.3.5 检查 点 


当 系 统 发 生 故 障 , 恢 复 子 系统 利用 日 志 进 行 恢 复 , 必 须 检 查 所 有 日 志 记录 , 即 搜索 整 
个 日 志 , 确 定 哪些 事务 需要 重 做 ,哪些 事务 需要 撤销 。 这 带 来 下 面 两 个 问题 。 

(1) 搜索 整个 日 志 将 耗费 大 量 的 时 间 。 

(2) 很 多 需要 重 做 处 理 的 事务 的 更 新 操作 实际 上 已 经 写 到 了 数据 库 中 。 也 就 是 说 ， 
已 经 输出 至 稳定 存储 器 ,对 这 些 事务 的 redo 处 理 , 将 浪费 大 量 时 间 。 

为 降低 这 些 不 必要 的 开销 ,引入 检查 点 机 制 。 

检查 点 技术 在 日 志文 件 中 增加 了 一 类 新 记录 一 一 检查 点 (checkpoint) 记 录 , 并 让 恢 
复 子 系统 在 登记 日 志文 件 期 间 动态 地 维护 日 志 。 为 简单 起 见 ,本 节 中 在 建立 检查 点 过 程 
中 不 允许 执行 任何 更 新 ,并 将 所 有 更 新 过 的 缓冲 块 输出 到 磁盘 。 

检查 点 的 建立 过 程 如 下 。 

(1) 将 当前 位 于 主 存 缓冲 区 的 所 有 日 志 记 录 输 出 到 稳定 存储 器 。 

(2) 将 所 有 更 新 过 的 数据 缓冲 块 输出 到 磁盘 。 

(3) 将 一 个 日 志 记 录 二 checkpoint L> 输 出 到 稳定 存储 器 ,其 中 是 执行 检查 点 时 
正 活跃 的 事务 列表 。 

在 日 志 中 引入 二 checkpoint L> 检 查 点 记录 ,大 幅 提 高 了 恢复 效率 。 

对 于 在 检查 点 前 完成 的 事务 T, 二 T, commit 二 或 二 Tabort 二 记录 在 日 志 中 出 现在 
去 checkpoint 世 之 记录 前 。TT 做 的 任何 数据 库 修 改 都 已 经 在 检查 点 前 或 者 作为 检查 点 
的 一 部 分 写 人 了 数据 库 ,因此 恢复 时 就 不 必 再 对 T 执 行 redo 操作 。 

系统 崩溃 发 生 后 ,系统 检查 日 志 找 到 最 后 一 条 二 checkpoint L 记 记录 (从 尾 端 开始 
反 向 搜索 日 志 遇 到 的 第 一 条 一 checkpoint 二 记录 即 最 后 一 条 二 checkpoint 工 二 记 
录 )。 只 需要 对 L 中 的 事务 ,以 及 <checkpoint 工 > 之 后 才 开始 执行 的 事务 进行 undo 或 
者 redo 操作 ,将 这 个 事务 集合 记 为 工 。 

对 工 中 的 事务 Ti , 若 事务 Ti 中 既 没 有 二 Ticommit 之 记录 ,也 没有 王 Tiabort> 记 录 ， 
则 对 事务 执行 undo(CT;) 。 

车 T; 在 日 志 中 有 过 Ticommit 记 或 二 T, abort 二 记录 , 则 执行 redo(T;) 。 

要 找 出 事务 集合 工 ,还 须 确定 了 中 的 每 个 事务 是 否 有 commit 或 者 abort 记录 出 现在 
日 志 中 ,只 需要 检查 日 志 中 从 最 后 一 条 checkpoint 日 志 记录 开始 的 部 分 。 
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考虑 日 志 集 合 {Tu ,TT ,T,,…,Tw}。 假 设 最 近 的 检查 点 发 生 在 事务 Te 和 Te 执行 
的 过 程 中 ,而 Tes 和 下 标 小 于 67 的 所 有 事务 在 检查 点 之 前 都 已 经 完成 。 检 查 点 恢复 机 制 
只 需要 考虑 事务 Ter ,Tss,… ,Too。。 其 中 已 经 完成 (提交 或 中 止 ) 的 事务 需要 重 做 ,未 完成 
的 事务 需要 撤销 。 

对 于 检查 点 日 志 记 录 中 的 事务 集合 L 中 的 每 个 事务 ,如果 本 没有 提交 ,撤销 它 可 
能 需要 该 事务 发 生 在 检查 点 日 志 记录 之 前 的 所 有 日 志 记录 。 更 进一步 地 分 析 ,一 旦 检查 
点 完成 了 ,最 先 出 现 的 二 Ti start 之 日 志 记 录 之 前 的 所 有 日 志 记 录 就 不 再 需要 了 。 这 里 ， 
T; 是 L 中 的 某 个 事务 。 当 数据 库 系 统 需要 回收 日 志 记录 占用 的 空间 时 ,就 可 以 清 掉 最 早 
<Ti start 之 之 前 的 日 志 记录 。 


16.4 恢复 算法 


本 节 讨 论 使 用 日 志 记录 从 事务 故障 中 恢复 的 完整 恢复 算法 ,以 及 结合 检查 点 技术 从 
系统 崩溃 和 介质 故障 中 恢复 的 算法 。 


16.4.1 事务 回 滚 


首先 考虑 正常 操作 时 的 事务 回 滚 , 即 逻辑 回 滚 。 事 务 T; 的 回 滚 执 行 操作 如 下 。 

(1) 从 日 志 尾 部 往 前 扫描 日 志 , 对 于 发 现 的 T; 的 每 个 形 如 二 T;,X;,Vi,V;, 二 的 日 志 
记录 : 

@ 值 Vi 被 写 到 数据 项 Xi 中 。 

@ 往日 志 中 写 一 个 特殊 的 只 读 日 志 记 录 志 T,Xi,w > ,其 中 人 是 在 本 次 回 滚 中 数 
据 项 X; 恢复 成 的 值 。 有 时 称 这 种 特殊 的 日 志 记 录 为 补偿 日 志 记 录 。 这 样 的 日 志 记录 不 
需要 undo 信息 ,因为 不 需要 撤销 这 样 的 undo 操作 。 后 面 解释 如 何 使 用 这 些 日 志 记录 。 

(2) 一 旦 发 现 了 二 T; start 之 日志 记录 ,就 停止 扫描 ,并 往日 志 中 写 一 个 <T; abort 二 
日 志 记 录 。 

事务 回 深 后 ,事务 所 做 的 每 个 更 新 动作 ,包括 将 数据 项 恢复 成 其 旧 值 的 动作 ,都 记录 
到 日 志 中 去 了 。 


16.4.2 系统 崩溃 后 的 恢复 


崩溃 发 生 后 数据 库 重 启 时 ,恢复 动作 分 两 个 阶段 进行 。 
1. 重 做 阶段 


在 重 做 阶段 ,系统 通过 从 最 后 一 个 检查 点 开始 正 向 扫描 日 志 来 重 放 所 有 事务 的 更 新 。 
重 放 的 日 志 记录 包括 在 系统 崩溃 前 已 经 回 滚 的 事务 的 日 志 记 录 , 以 及 在 系统 崩溃 发 生 时 
还 没有 提交 的 事务 的 日 志 记录 。 这 个 阶段 同时 还 确定 在 系统 故障 发 生 时 ,必须 回 滚 的 事 
务 。 确 定 的 原理 是 : 故障 时 ,未 完成 事务 或 者 在 检查 点 建立 时 是 活跃 的 ,或 者 是 在 检查 点 
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建立 之 后 开始 的 ,并 且 未 完成 ,因此 必须 回 滚 。 

扫描 日 志 的 过 程 中 采用 的 具体 步骤 如 下 。 

(1) 将 要 回 滚 的 事务 的 列表 undo-list 初始 设 定 为 二 checkpoint LL 日 志 记 录 中 的 
工 列表 。 

(2) 一 旦 遇 到 形 为 二 Ti ,Xi,Vi,V:> 的 正常 日 志 记录 或 者 形 为 二 Ti ,Xi,V: 过 的 
redo-only 日 志 记录 ,就 重 做 这 个 操作 ,也 就 是 说 ,将 V: 的 值 写 给 数据 项 X;。 

(3) 一 且 发 现形 为 二 Ti start 记 的 日 志 记录 ,就 把 T; 加 到 undo-list 中 。 

(4) 一 旦 发 现形 为 二 Ti commit 二 或 二 Ti abort 二 的 日 志 记 录 , 就 把 T 从 undo-list 中 
去 掉 。 

在 redo 阶段 的 末尾 ,undo-list 包括 在 系统 崩溃 之 前 尚未 完成 的 所 有 事务 , 即 既 没有 
提交 ,也 没有 完成 回 滚 的 那些 事务 。 


2. 撤销 阶段 


在 撤销 阶段 ,系统 回 滚 undo-list 中 的 所 有 事务 。 系 统 从 尾 端 开始 反 向 扫描 日 志 来 执 
行 回 滚 。 

(1) 一 旦 发 现 属于 undo-list 中 的 事务 的 日 志 记录 ,就 执行 undo 操作 ,就 像 在 一 个 失 
败 事务 的 回 滚 过 程 中 发 现 了 该 日 志 记录 一 样 。 

(2) 当 系 统 发 现 undo-list 中 事务 T; 的 天 Ti start 二 日 志 记 录 , 系 统 就 往日 志 中 写 一 
个 二 T; abort 之 日 志 记 录 , 并 且 把 T; 从 undo-list 中 去 掉 。 

(3) 一 旦 undo-list 变 为 空 列表 ,系统 就 找到 了 位 于 undo-list 中 的 所 有 事务 的 二 T; 
start 记 日 志 记 录 , 撤 销 阶段 结束 。 

恢复 过 程 的 撤销 阶段 结束 之 后 ,就 可 以 重新 开始 正常 的 事务 处 理 了 。 

在 重 做 阶段 ,从 最 近 的 检查 点 记录 开始 重 放 每 个 日 志 记 录 。 也 就 是 说 ,重启 恢复 这 个 
阶段 将 重复 执行 检查 点 之 后 输出 至 稳定 存储 器 的 日 志 记 录 对 应 的 所 有 数据 更 新 动作 。 这 
些 动作 包括 未 完成 事务 的 动作 和 回 滚 失 败 的 事务 执行 的 动作 ,当然 也 包括 成 功 提交 的 事 
务 动作 。 这 些 动作 按照 它们 原先 执行 的 次 序 重复 ,因此 将 这 一 过 程 称 为 重复 历史 
(Repeating History)。 貌 似 浪费 , 即 对 失败 事务 也 重复 ,但 实际 简化 了 恢复 过 程 。 


16.4.3 介质 故障 后 的 恢复 


介质 故障 后 的 恢复 需要 DBA 介入 。DBA 重 装 最 近 转 储 的 数据 库 副 本 和 有 关 的 各 日 
志文 件 副本 执行 系统 提供 的 恢复 命令 ,具体 的 恢复 操作 仍 由 DBMS 完成 。 

恢复 步骤 如 下 。 

(1) 装 入 最 新 的 数据 库 副本 ,使 数据 库 恢复 到 最 近 一 次 转 储 时 的 一 致 性 状态 。 

对 于 静态 转 储 的 数据 库 副 本 , 装 人 后 数据 库 处 于 一 致 性 状态 。 

对 于 动态 转 储 的 数据 库 副本 ,还 须 同 时 装 入 转 储 时 刻 的 日 志文 件 副 本 ,利用 与 恢复 系 
统 故障 相同 的 方法 ( 即 redo 十 undo) ,才能 将 数据 库 恢复 到 一 致 性 状态 。 

(2) 装 入 有 关 的 日 志文 件 副 本 , 重 做 已 完成 的 事务 。 
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首先 扫描 日 志文 件 , 找 出 故障 发 生 时 已 提交 的 事务 的 标识 ,将 其 记 入 重 做 队列 。 
然后 正 向 扫描 日 志文 件 , 对 重 做 队列 中 的 所 有 事务 进行 重 做 处 理 , 即 将 日 志 记录 中 
“更 新 后 的 值 " 写 和 数据库。 重 做 事务 的 过 程 与 系统 故障 的 重 做 过 程 类 似 , 这 里 不 再 缆 述 。 


16.5 小 结 


数据 库 恢复 (recovery) 指 数据 库 管理 系统 具有 能 把 数据 库 从 被 破坏 、 不 正确 的 状态 
恢复 到 最 近 一 个 正确 状态 的 能 力 。 恢 复 子 系统 是 数据 库 管 理 系统 的 一 个 重要 组 成 部 分 。 

数据 库 系统 故障 大 致 分 为 事务 故障 系统 故障 和 介质 故障 3 类 。 

恢复 技术 的 基本 原理 很 简单 ,就 是 建立 “元 余 ”。 

恢复 机 制 的 两 个 关键 问题 是 建立 元 余数 据 ,利用 元 余数 据 实现 恢复 。 

建立 元 余数 据 包 括 数据 转 储 数据 库 本 身 和 建立 日 志 。 

为 保证 数据 库 是 可 恢复 的 ,登记 日 志文 件 时 必须 遵循 两 个 原则 : 登记 的 次 序 为 并 行 
事务 执行 的 时 间 次 序 ; 必 须 先 写 日 志文 件 ,后 写 数据 库 。 

为 降低 这 些 不 必要 的 开销 ,引入 了 检查 点 机 制 。 


16.6 习题 


.什么 是 数据 库 恢复 ? 

. 恢复 的 基本 原理 是 什么 ? 
. 登记 日 志 的 原则 是 什么 ? 
. 简 述 事务 故障 恢复 的 过 程 。 
. 简 述 系统 故障 恢复 的 过 程 。 
. 简 述 介质 故障 恢复 的 过 程 。 


中 no 性 





308| 











本 篇 包含 第 17 章 的 内 容 ,主要 介绍 数据 库 系 统 发 展 的 特点 、 数 
据 管 理 技术 发 展 的 趋势 .数据库 发 展 新 技术 、 对 象 关系 型 数据 库 、 分 
布 式 数 据 库 、 并 行 数据 库 、 空 间 数 据 库 、 数 据 仓 库 与 数据 挖掘 、 大 数 
据 与 NoSQL 和 NewSQL。 


第 17 章 数据 库 的 发 展 及 新 技术 


从 IBM 公司 开发 的 第 一 个 数据 库 系统 IMS 开始 ,数据 库 技术 经 过 了 近 50 年 的 发 
展 ,已 成 为 一 个 数据 模型 丰富 、 新 技术 内 容 层出不穷 .应 用 领域 日 益 广泛 的 体系 ,是 计算 机 
科学 技术 中 发 展 最 快 、 应 用 最 广泛 的 分 支 之 一 。 

1990 年 2 月 ,美国 国家 科学 基金 会 主持 的 数据 库 学 术 研 究 界 和 工业 界 联 席 会 议 对 数 
据 库 技术 的 新 发 展 做 出 了 结论 。 

(1) 支持 21 世纪 初 工业 化 经 济 的 大 量 先进 技术 都 将 依赖 新 的 数据 库 技术 ,需要 对 这 
些 新 技术 进行 深入 和 持久 的 研究 。 

(2) 新 一 代数 据 库 应 用 与 目前 的 事务 处 理 数据 库 应 用 大 不 一 样 , 将 涉及 更 多 的 数据 ， 
需要 新 的 能 力 , 包 括 类 型 扩充 、 多 媒体 支持 ,复杂 对 象 , 规 则 处 理 和 档案 存储 等 ,需要 重新 
考虑 几乎 所 有 DBMS 的 操作 算法 。 

(3) 不 同 组 织 机 构 之 间 需 要 超大 范围 的 ,异种 的 ,分布 的 数据 库 在 通常 的 科学 \ 工 程 
和 经 济 问题 上 的 协同 操作 。 


17.1 数据 库 系 统 发 展 的 特点 


数据 库 的 发 展 虽然 百花 齐 放 ,但 其 发 展 方向 大 致 遵循 下 面 3 条 途径 ,如 图 17.1 所 示 。 
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1. 数据 模型 的 发 展 


数据 库 的 发 展 集中 表现 在 数据 模型 的 发 展 上 ,从 最 初 的 层次 模型 、 网 状 模型 发 展 到 关 
系 模 型 ,数据 库 技 术 产生 了 3 次 巨大 的 飞跃 。 

随 着 数据 库 应 用 领域 的 扩展 以 及 数据 对 象 的 多 样 化 ,传统 的 关系 数据 模型 已 经 逐渐 
暴露 出 许多 弱点 ,如 复杂 对 象 表示 能 力 差 ,语义 表达 能 力 较 弱 ,缺乏 灵活 丰富 的 建 模 能 力 ， 
对 文本 时间、 空间 声音 、 图 像 和 视频 等 复杂 数据 类 型 的 处 理 能 力 差 等 。 因 此 ,人 们 提出 
并 发 展 了 许多 新 的 数据 模型 。 

1) 面向 对 象 数据 模型 

将 数据 模型 和 面向 对 象 程序 设计 方法 结合 起 来 ,用 面向 对 象 的 观点 来 描述 现实 世界 。 
现实 世界 的 任何 事物 都 被 建 模 为 对 象 ,而 对 象 又 是 属性 和 方法 的 封装 。 

它 与 传统 数据 库 一 样 既 实 现 数据 的 增加 、 删 除 、 修 改 ,查询 的 操纵 功能 ,也 具有 并 发 控 
制 ,故障 恢复 存储 管理 的 功能 。 不 仅 支持 传统 的 数据 库 应 用 ,也 能 支持 非 传统 领域 的 应 
用 ,包括 CAD/CAM\`OA、`CIMS GIS 以 及 图 形 图 像 等 多 媒体 领域 .工程 领域 和 数据 集成 
等 领域 。 但 是 ,面向 对 象 数据 库 管 理 系统 太 过 复杂 ,导致 并 没有 得 到 广泛 应 用 ,没有 得 到 
广大 用 户 的 支持 ,因此 在 市 场 上 没有 获得 成 功 。 

关系 对 象 型 数据 库 管 理 系统 是 在 关系 型 数据 库 管理 系统 的 基础 上 增加 了 面向 对 象 的 
管理 能 力 。 其 中 ,SQL 99 标准 提供 了 面向 对 象 的 支持 。 

2) XML 数据 模型 

随 着 互联 网 的 迅速 发 展 ,Web 上 各 种 半 结 构 化 、 非 结构 化 数据 源 已 经 成 为 重要 的 信 
息 来 源 。 可 扩展 标记 语言 (eXtended Markup Language,XML) 已 经 成 为 网 上 数据 交换 的 
标准 和 研究 的 热点 ,人 们 研究 和 提出 了 表示 半 结 构 化 数据 的 XML 数据 模型 。 

XML 数据 模型 没有 严格 的 模式 规定 , 它 的 结构 不 固定 ,模式 由 数据 自 描述 。 纯 XML 
数据 库 系 统 在 面临 传统 关系 数据 库 的 各 项 问题 ,如 查询 优化 、 并 发 .事务 、 索 引 等 时 ,并 没 
有 良好 的 解决 办 法 。 因 此 ,一 般 采 取 在 传统 的 关系 数据 库 系统 基础 上 扩展 对 XML 数据 
的 支持 。 


2. 数据 库 技术 与 相关 技术 相 结 合 


随 着 数据 库 技术 应 用 领域 的 不 断 扩展 ,数据 库 技术 与 其 他 计算 机 技术 相 结合 ,涌现 出 
如 下 各 种 数据 库 系 统 。 

分 布 式 数据 库 系统 ,由 数据 库 技术 与 分 布 式 处 理 技术 相 结合 。 

并 行 数据 库 系统 ,由 数据 库 技术 与 并 行 处 理 技术 相 结合 。 

多 媒体 数据 库 系统 ,由 数据 库 技术 与 多 媒体 技术 相 结 合 。 

移动 数据 库 系 统 , 由 数据 库 技术 与 移动 技术 相 结 合 。 

模糊 数据 库 系 统 , 由 数据 库 技术 与 模糊 技术 相 结 合 。 

Web 数据 库 系 统 , 由 数据 库 技术 与 Web 技术 相 结合 。 

数据 库 技术 与 人 工 智能 技术 相 结 合 出 现 了 演绎 数据 库 、 知 识 库 和 主动 数据 库 系统 。 
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3. 数据 库 技术 与 应 用 领域 相 结 合 
数据 库 技术 被 应 用 到 特定 的 领域 中 ,出 现 了 数据 仓库 .工程 数据 库 、 统 计数 据 库 空间 
































数据 库 等 多 种 数据 库 ,如 图 17. 2 所 示 。 
特定 应 用 领域 数据 库 新 技术 内 容 
EIS&DSS 数据 仓库 
CAD/CAM/CIM 工程 数据 库 
数据 库 技术 
计划 、 统 计 统计 数据 库 
地 理 信息 系统 空间 数据 库 




















图 17.2 数据 库 技术 与 应 用 领域 相 结合 


工程 数据 库 (Engineering Data Base, EDB) 是 一 种 能 存储 和 管理 各 种 工程 设计 图 形 
和 工程 设计 文档 ,并 能 为 工程 设计 提供 各 种 服务 的 数据 库 , 它 又 称 为 CAD 数据库。 工程 
数据 库 适合 CADVCAMVCIM、 地 理 信 息 处 理 、 军 事 指挥 .控制 .通信 等 工程 应 用 领域 。 

空间 数据 库 是 用 于 存储 表示 空间 物体 的 位 置 .形状 .大 小 和 分 布 特征 等 各 方面 信息 的 
数据 ,适用 于 二 维 、 三 维和 多 维 应 用 的 领域 。 

除了 以 上 3 种 途径 外 ,还 出 现 了 内 存 数 据 库 \、 以 图 形 图 像 的 方式 形象 地 显示 各 种 数据 
的 数据 可 视 化 技术 等 。 


17.2 数据 管理 技术 发 展 的 趋势 


数据 应 用 需求 和 计算 机 软 硬 件 技术 是 推动 数据 库 技术 发 展 的 3 个 主要 动力 。 随 着 
电子 商务 ,移动 互联 网 . 自 媒体 、 物 联网 ` 无 线 网 络 ,. 嵌 入 式 等 技术 的 发 展 , 获 取 数据 的 方式 
的 多 样 化 .智能 化 ,数据 量 呈 现 爆炸 式 增长 。 而 数据 类 型 也 越 来 越 多 样 和 异 构 , 从 结构 化 
的 数据 扩展 到 文本 、 图 形 图 像 、 音 频 、 视 频 等 多 媒体 数据 库 , HTML、XML、 网 页 等 半 结 构 
化 数据 ,还 有 流 数据 ,队列 数据 和 程序 数据 ,人 位置. 形状. 大 小 等 空间 数据 ,传感器 数据 ， 
RFID( 无 线 射频 识别 ) 等 物 联 网 数据 。 这 就 要 求 系统 具有 存储 和 处 理 多 样 异 构 数 据 的 能 
力 ,以 满足 对 复杂 数据 处 理 的 需求 。 而 传统 数据 库 对 半 结 构 及 非 结 构 化 数据 的 管理 能 力 
非常 有 限 。 不 仅 如 此 ,数据 中 可 能 存在 大 量 的 宛 余 和 噪声 ,数据 量 用 海量 来 形容 ,其 描述 
单位 不 断 扩大 ,数据 实时 性 要 求 高 等 。 

人 们 和 希望 从 数据 中 获取 更 高 的 价值 。 数 据 应 用 从 OLTP( 联 机 事务 处 理 ) 为 代表 的 事 
务 处 理 扩展 到 OLAP( 联 机 分 析 处 理 ) 分 析 处 理 , 从 多 结构 化 海量 历史 数据 的 多 维 分 析 发 
展 到 海量 非 结构 化 数据 的 复杂 分 析 和 深度 挖掘 ,并 且 和 希望 把 数据 仓库 的 结构 化 数据 和 互 
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联网 上 的 非 结构 化 数据 结合 起 来 进行 分 析 挖 掘 ,把 历史 数据 和 实时 流 数据 结合 起 来 进行 
处 理 , 但 是 大 数据 分 析 成 为 大 数据 应 用 中 的 瓶颈 。 人 们 已 经 认识 到 基于 数据 进行 分 析 的 
广阔 前 景 。 

计算 机 硬件 技术 是 数据 库 系 统 的 基础 。 当 今 ,计算 机 硬件 体系 结构 的 发 展 十 分 迅速 ， 
数据 处 理 平台 从 单 处 理 器 向 多 核 、 大 内 存 、 集 群 云 计算 平台 转移 。 处 理 器 全 面 进 入 多 核 
时 代 。 我 们 必须 充分 利用 新 的 硬件 技术 满足 海量 数据 的 存储 和 管理 的 需求 。 一 方面 要 对 
现 有 的 传统 数据 库 体系 结构 (包括 存储 策略 、 存 取 方 法 ,查询 处 理 策略 ,查询 算法 .事务 管 
理 ) 重 新 设计 和 开发 ;一 方面 ,针对 大 数据 需求 ,以 集群 云 计 算 、 云 存储 为 特征 设计 开发 新 
的 数据 库 系统 。 

大 数据 给 数据 管理 ,处 理 和 分 析 提 出 全 面 的 挑战 。 传 统 数 据 库 的 发 展 出 现 了 瓶颈 ， 
NoSQL 数据 库 技术 应 运 而 生 , 以 满足 人 们 对 大 数据 处 理 的 需求 。 

以 上 这 些 都 给 传统 的 数据 库 提 出 了 新 的 要 求 和 挑战 。 


17.3 面向 对 象 数据 库 管理 系统 


20 世纪 80 年 代 初 期 ,正当 数据 库 产 品 在 事务 处 理 领 域 取 得 巨大 成 功 时 ,一 些 其 他 领 
域 也 表现 了 采用 数据 库 技术 的 兴趣 。 


17.3.1 面向 对 象 数据 库 管理 系统 介绍 


工程 应 用 领域 中 (如 CADVCAM .CIMS( 计 算 机 集成 制造 系统 )) 涉 及 的 数据 种 类 多 
(如 图 形 数据 文字 数据 .数字 数据 等 ), 相 应 的 操作 (如 图 形 操作 文字 操作 、 数 字 操 作 等 ) 
极为 复杂 。 工 程 领域 需要 的 数据 模型 也 较 复 杂 、 特 殊 , 而 且 数据 关系 也 极 复杂 。 这 些 都 是 
传统 的 关系 型 数据 库 系统 无 法 支持 的 。 在 多 媒体 应 用 领域 中 也 同样 存在 数据 类 型 复杂 、 
数据 联系 复杂 的 情况 ,因此 ,也 存在 同样 的 传统 数据 库 无 法 解决 的 问题 。 而 这 些 问题 通过 
面向 对 象 数据 库 都 可 以 得 到 解决 。 

面向 对 象 数据 库 是 沿 着 3 条 路 线 发 展 的 。 

第 一 条 发 展 路 线 , 是 在 传统 的 关系 数据 库 管 理 系统 的 基础 上 扩展 对 面向 对 象 模型 的 
支持 ,如 DB2 Oracle、SQL Server 等 。 

第 二 条 发 展 路 线 , 是 在 面向 对 象 程序 设计 语言 的 基础 上 ,研究 持久 的 程序 设计 语言 ， 
支持 面向 对 象 数 据 模型 ,如 GemStone 的 Smalltalk。 

第 三 条 发 展 路 线 , 建 立新 的 面向 对 象 数据 库 系 统 ,支持 面向 对 象 数据 模型 ,如 法 国 
O2Technology 公司 的 02 和 美国 Itasca System 公司 的 Itasca 等 。 


1. 面向 对 象 数据 库 的 定义 及 相关 概念 


面向 对 象 数据 库 系 统 至 少 满足 以 下 两 个 基本 要 求 : 必须 是 一 个 面向 对 象 的 系统 ; 
回 必须 是 一 个 数据 库 系统 。 也 就 是 说 , 它 必须 支持 面向 对 象 的 数据 模型 ,提供 面向 对 象 的 
数据 库 语言 ,提供 面向 对 象 数据 库 管 理 机 制 ,同时 具有 传统 数据 库 的 管理 能 力 。 
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面向 对 象 数据 库 是 使 用 面向 对 象 数据 模型 表示 实体 及 实体 之 间 联 系 的 模型 ,同样 也 
分 为 数据 结构 ,数据 操作 和 完整 性 约束 3 方面 来 描述 。 

(1) 数据 结构 ,面向 对 象 数据 模型 的 基本 结构 是 对 象 和 类 。 现 实 世界 的 任 一 实体 都 
被 统一 地 模型 化 为 一 个 对 象 。 

(2) 数据 操作 ,面向 对 象 数据 模型 中 ,数据 操作 分 为 两 个 部 分 : 一 部 分 封装 在 类 中 ， 
称 为 方法 ; 另 一 部 分 是 类 之 间 相互 沟通 的 操作 , 称 为 消息 。 

(3) 完整 性 约束 ,面向 对 象 数据 模型 中 一 般 使 用 消息 或 方法 表示 完整 性 约束 条 件 , 它 
们 称 为 完整 性 约束 消息 与 完整 性 约束 方法 。 

面向 对 象 数 据 库 包 含 的 几 个 核心 概念 : 对 象 . 封 装 .类 继承、 消息 。 

(1) 对 象 。 现 实 世 界 的 任 一 实体 都 被 统一 模型 化 为 一 个 对 象 (object) ,每 个 对 象 有 一 
个 唯一 的 标识 , 称 为 对 象 标识 (OID)。 对 象 是 现实 世界 中 实体 的 模型 化 ,与 记录 、 元 组 
类 似 。 

(2) 封装 。 每 个 对 象 是 其 属性 与 行为 的 封装 ,行为 是 对 象 上 的 操作 方法 。 

(3) 类 。 同 一 属性 集合 及 方法 集合 的 所 有 对 象 组 合 在 一 起 构成 一 个 对 象 类 class, 简 
称 为 类 。 一 个 对 象 是 一 个 类 的 实例 。 例 如 ,教师 是 一 个 类 ,具体 的 某 个 教师 (如 刘 思 ) 是 教 
师 类 中 的 一 个 对 象 。 类 是 型 ,对 象 是 值 。 每 个 类 都 包含 了 属性 和 方法 ,而 每 个 属性 可 以 是 
基本 的 数据 类 型 (如 整 型 .字符 型 )。 

(4) 继承 。 类 可 以 继承 , 即 一 个 类 可 以 有 多 个 超 类 ,分 为 直接 的 超 类 和 间接 的 超 类 。 
一 个 类 可 以 继承 它 的 所 有 超 类 的 属性 和 方法 。 

(5) 消息 。 对 象 是 封装 的 ,对 象 之 间 的 通信 是 通过 消息 传递 来 实现 的 , 即 消息 从 外 部 
传递 给 对 象 , 存 取 和 调用 对 象 中 的 属性 和 方法 ,在 内 部 执行 要 求 的 操作 ,操作 的 结果 仍 以 
消息 的 形式 返回 。 

如 图 17. 3 所 示 ,教工 和 学 生 分 别 定义 为 教工 类 和 学 生 类 ,它们 都 继承 了 人 这 个 类 , 教 
工 类 和 学 生 类 也 都 继承 了 人 的 所 有 属性 和 方法 。 同 样 ,本 科 生 继承 了 学 生 类 及 人 类 的 所 
有 属性 和 方法 。 李 思 是 学 校 的 一 名 具体 教师 ,他 具有 教工 类 的 所 有 属性 和 方法 ,他 有 姓 
名 .性别 .职称 等 属性 ,他 具有 教书 这 个 方法 ,同时 还 封装 了 其 他 一 些 方法 。 
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2. 面向 对 象 数据 库 子 语言 


1993 年 ,目标 数据 库 管理 组 (Object Data Management Group,ODMG ) 形 成 工业 化 
的 面向 对 象 数据 库 标 准 ODMG-93。 它 是 基于 对 象 的 ,把 对 象 作为 基本 构造 ,是 用 于 面向 
对 象 数据 库 管理 产品 接口 的 一 个 定义 。 各 个 产品 对 ODMG-93 思想 的 实现 区 别 很 大 。 
1997 年 ,ODMG 组 织 公布 了 第 2 个 标准 ODMG-97 ,内容 涉 及 对 象 模型 ,对象 定 义 语言 、 
对 象 交换 格式 、 对 象 查询 语言 ,以 及 这 些 内 容 与 C++ 、Smalltalk、Java 之 间 的 衔接 。 对 象 
定义 语言 (Object Definition Language,ODL) 是 基于 面向 对 象 定义 的 语言 ,而 对 象 查询 语 
言 (Object Query Language,OQL) 是 基于 面向 对 象 的 数据 查询 语言 。 





17.3.2 ”对象 关系 数据 库 管 理 系统 介绍 


基于 对 象 关系 数据 模型 建立 的 数据 库 系统 称 为 “对 象 关 系数 据 库 系统 "(ORDBS)。 
对 象 关 系数 据 库 管理 系统 (ORDBMS) 具 有 关系 数据 库 管理 系统 的 功能 ,同时 又 支持 面向 
对 象 的 某 些 特性 ,主要 是 能 扩充 基本 数据 类 型 ,支持 复合 对 象 , 增 加 复合 对 象 继承 机 制 和 
支持 规则 系统 。 它 是 在 传统 的 关系 数据 库 管 理 系统 的 基础 上 增加 面向 对 象 的 特性 ,把 面 
向 对 象 技术 与 关系 数据 库 技 术 结 合 起 来 。 


1. 对 象 关系 数据 库 子 语言 


20 世纪 80 年 代 中 期 , 随 着 面向 对 象 技术 的 兴起 ,人 们 设法 在 SQL 标准 语言 的 基础 
上 增加 面向 对 象 内 容 ,1999 年 ,国际 标准 化 组 织 (ISO) 发 布 了 SQL-3 标准 ,该 标准 又 称 为 
SQL:1999。SQL-3 支持 对 象 关系 数据 库 模型 。SQL-3 包含 以 下 几 部 分 内 容 。 

(1) 具有 关系 数据 库 系 统 SQL 的 基本 功能 。 

(2) 具有 定义 复杂 数据 类 型 和 抽象 数据 类 型 的 功能 。 

(3) 具有 数据 间 组 合 与 继承 的 功能 。 

(4) 具有 函数 定义 和 使 用 的 功能 。 

(5) SQL-3 以 表 为 基本 数据 结构 , 它 的 定义 形式 和 查询 语言 与 传统 的 SQL 类 似 。 


2. OODBMS .ORDBMS .RDBMS 的 区 别 


RDBMS 不 支持 用 户 自 定义 数据 类 型 和 面向 对 象 的 特征 ,而 ORDBMS 和 OODBMS 支 
持 。ORDBMS 支持 SQL-3 语言 标准 ,而 OODBMS 支持 ODMG97 中 的 OQL 和 ODL。 另 
外 ,ORDBMS 和 OODBMS 的 面向 对 象 的 实现 原理 不 同 ,ORDBMS 是 在 RDBMS 中 增加 新 的 
数据 类 型 和 面向 对 象 的 特征 ;而 OODBMS 则 是 在 程序 设计 语言 中 增加 DBMS 的 功能 。 


17.4 分 布 式 数据 库 


1. 分 布 式 数据 库 的 定义 
分 布 式 数据 库 系统 是 物理 上 分 散 ,而 逻辑 上 集中 的 数据 库 系 统 。 它 使 用 计算 机 网 络 
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将 地 理 分 散 而 管理 和 控制 又 需要 不 同 程度 集中 的 多 个 逻辑 单位 连接 起 来 ,共同 组 成 一 个 
统一 的 数据 库 系 统 。 它 是 计算 机 网 络 与 数据 库 系统 的 有 机 结合 。 

在 分 布 式 数据 库 系 统 中 ,被 计算 机 网 络 连 接 的 每 个 逻辑 单位 是 能 够 独立 工作 的 计算 
机 ,这 些 计算 机 称 为 站 点 或 场地 ,也 称 为 结 点 。 地 理 位 置 上 分 散 是 指 各 个 站 点 分 散在 不 同 
的 地 方 , 大 可 以 到 不 同 的 国家 ,小 可 以 在 一 个 机 房 。 逻 辑 上 集中 指 各 站 点 之 间 虽 然 不 是 相 
关 的 ,但 它们 是 一 个 逻辑 整体 ,并 由 一 个 统一 的 数据 库 管理 系统 进行 管理 ,这 个 数据 库 管 
理 系统 称 为 分 布 式 数据 库 管 理 系 统 (Distributed DataBase Management System， 
DDBMS) 。 分 布 式 数据 库 系 统 的 体系 结构 如 图 17. 4 所 示 ,每 个 大 圆圈 就 是 一 个 结 点 。 各 


个 结 点 通过 通信 网 络 连接 起 来 ,每 个 结 点 一 般 是 一 个 集中 式 数据 库 系 统 , 它 由 数据 库 服务 
器 及 若干 终端 (客户 机 ) 构 成 。 





























客户 机 n | / 

















图 17.4 分 布 式 数据 库 系统 的 体系 结构 


2. 分 布 式 数据 库 的 特点 


1) 物理 分 布 性 

分 布 式 数据 库 系 统 中 的 数据 不 存储 在 一 个 结 点 上 ,而 是 分 散在 由 计算 机 网 络 连 接 起 
来 的 多 个 结 点 上 ,但 这 种 分 散 对 用 户 是 透明 的 ,用 户 感觉 不 到 。 

2) 逻辑 整体 性 


虽然 这 些 数据 物理 分 散在 不 同 结 点 ,但 是 逻辑 上 却 是 统一 的 ,它们 被 所 有 用 户 共享 ， 
由 一 个 分 布 式 数据 库 管理 系 统统 一 管理 。 
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3) 站 点 自治 性 

各 个 站 点 的 数据 由 本 地 的 数据 库 管理 系统 所 管理 ,完成 本 站 点 的 局 部 应 用 。 

4) 场地 之 间 的 协作 性 

各 个 场地 虽然 具有 较 高 度 的 自治 性 ,但 又 相互 协作 构成 一 个 整体 ,用 户 可 以 在 任何 一 
个 场地 执行 全 局 应 用 。 


3. 分 布 式 数 据 库 分 类 


(1) 同 构 同 质 型 DDBS( 分 布 式 数据 库 系统 ): 各 个 场地 采用 同一 类 型 的 数据 模型 (如 
都 是 关系 型 ) ,并且 是 同一 型 号 的 DBMS。 

(2) 同 构 异 质 型 DDBS: 各 个 场地 采用 同一 类 型 的 数据 模型 ,但 是 DBMS 的 型 号 不 
同 ,如 DB2、Oracle,MySQL、Sysbase、SQL Server 等 。 

(3) 异 构 型 DDBS: 各 个 场地 的 数据 模型 不 一 样 ,DBMS 的 型 号 也 不 同 。 


4. 分 布 式 数 据 库 的 举例 


(1) 假设 一 个 银行 系统 由 多 个 分 布 在 不 同城 市 的 支行 系统 组 成 ,如 图 17. 5 所 示 。 每 
个 支行 是 这 个 系统 中 的 一 个 结 点 。 它 存放 了 其 所 在 城市 的 所 有 账户 的 数据 库 。 各 个 支行 
通过 网 络 连 接 可 以 相互 通信 ,组 成 一 个 整体 的 银行 系统 。 









A 城市 支行 D 城 市 支行 


B 城 市 支行 C 城 市 支行 


图 17.5 银行 分 布 式 数据 库 架 构 





当 用 户 需 要 异地 存 取款 时 ,就 称 为 一 个 全 局 事务 ,需要 各 个 结 点 通信 来 解决 。 例 如 ， 
用 户 在 A 城市 开 了 账户 并 存 了 10000 元 钱 , 则 此 用 户 的 账户 信息 存放 在 A 城市 的 数据 库 
服务 器 中 , 当 此 用 户 要 在 B 城市 取 钱 时 ,A 城市 的 计算 机 就 要 将 这 一 全 局 事务 通过 结 点 
通信 进行 处 理 。 

(2) 图 17. 6 是 一 个 高 校 数据 库 系统 架构 ,该 学 校 由 A、B、C 3 个 校区 组 成 ,每 个 校区 
的 师 生 及 相关 数据 都 保存 在 当地 数据 库 服 务 器 ,如 A 校区 的 教师 及 学 生 数据 保存 在 A 校 
区 。 如 果 想 查询 A 校区 所 有 教授 的 信息 ,那么 只 需要 查询 A 校区 的 数据 库 服 务 器 ,这 种 
查询 只 涉及 一 个 站 点 , 叫 作 局 部 查询 。 如 果 想 查询 整个 学 校 所 有 教授 的 信息 ,那么 这 个 查 
询 将 检索 所 有 数据 库 服务 器 ,分 别 检索 A、B、C 3 个 数据 库 服务 器 的 教授 信息 ,最 后 把 3 
个 站 点 的 查询 结果 进行 合并 。 这 种 涉及 多 个 站 点 的 查询 叫 作 全 局 查询 ,也 属于 全 局 事务 。 
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加 数据 库 服务 器 
DO 


A 校区 


C 校 区 B 校 区 


国 数据 库 服务 器 


图 17.6 高 校 数 据 库 系统 架构 


17.5 并行 数 据 库 


1. 并 行 数据 库 的 定义 及 相关 概念 


并 行 数据 库 是 并 行 技术 与 数据 库 技术 相 结合 的 产物 ,也 是 当今 社会 研究 的 热点 数据 
库 技术 之 一 。 处 理 机 \ 内 存 ,芯片 等 物理 元 件 的 发 展 潜力 越 来 越 小 ,不 可 能 无 限制 地 提供 
其 速度 和 功能 。 并 行 处 理 技术 利用 大 量 处 理 机 并 行 处 理 来 提高 性 能 ,已 经 证 明 不 仅 具有 
极 大 的 可 行 性 ,而 且 也 是 计算 机 发 展 的 必由之路 。 

并 行 数据 库 可 以 充分 发 挥 多 处 理 机 结构 的 优势 ,将 数据 分 布 存储 在 多 个 磁盘 上 ,并 且 
利用 多 个 处 理 机 对 磁盘 数据 进行 并 行 处 理 , 以 提高 速度 。 并 行 数据 库 管理 系统 的 基本 思 
想 是 通过 先进 的 并 行 查询 技术 ,开发 查询 间 并 行 、 查 询 内 并 行 以 及 操作 内 并 行 ,来 提高 性 
能 和 查询 的 效率 。 


2. 并 行 数据 库 的 体系 结构 


并 行 数据 库 系统 的 基本 思想 是 通过 并 行 执行 来 提高 性 能 。 其 体系 结构 主要 分 为 全 共 
享 结构 .无 共享 结构 .共享 磁盘 结构 3 类 ,如 图 17.7 所 示 。 

全 共享 结构 : 主要 指 多 个 处 理 机 通过 网 络 进行 通信 ,共享 访问 内 存 和 磁盘 。 因 此 ,内 
存 访问 冲突 将 会 是 这 种 并 行 结构 的 瓶颈 ,这 种 结构 中 CPU 的 数目 不 能 太 多 。 

无 共享 结构 : 每 个 处 理 机 有 自己 独立 的 磁盘 和 内 存 , 处 理 器 之 间 通 过 网 络 进行 通信 。 
此 种 结构 被 认为 是 最 佳 的 并 行 数据 库 结构 。 

共享 磁盘 结构 : 每 个 处 理 机 有 自己 独立 的 内 存 , 通 过 网 络 共享 访问 磁盘 。 这 种 结构 
消除 了 内 存 访 问 的 瓶颈 ,但 是 磁盘 访问 冲突 成 为 瓶颈 。 

并 行 数据 库 系统 中 虽然 已 经 取得 了 一 些 成 果 , 但 是 仍然 有 大 量 问题 需要 研究 。 

(1) 并 行 体系 结构 。 
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(b) 无 共享 (c) 共享 磁盘 
图 17.7 并 行 数据 库 的 体系 结构 





(2) 为 提高 并 行 查询 效率 ,研究 并 行 操作 算法 。 

(3) 并 行 查询 优化 。 

(4) 并 行 数据 库 的 物理 设计 。 

(5) 并 行 数据 库 的 数据 加 载 和 再 组 织 技术 。 

并 行 数据 库 与 分 布 式 数据 库 经 常 在 一 起 结合 使 用 ,它们 有 很 多 相似 点 ,都 是 利用 网 络 
连接 各 个 数据 库 结 点 ,所 有 结 点 构成 逮 辑 上 统一 的 整体 。 但 是 它们 有 很 大 的 不 同 , 主 要 有 
@ 应 用 目的 不 同 。 并 行 数据 库 是 调动 所 有 结 点 并 行 地 完成 某 个 任务 ,提高 整体 性 能 ;分 布 
式 数据 库 的 目的 是 实现 站 点 自治 和 全 局 透明 共享 。 回 网络 连 接 方法 不 同 。 并 行 数 据 库 系 
统 采用 高 速 网 络 将 各 个 结 点 连接 起 来 .实现 高 速 传输 ,而 分 布 式 数据 库 系统 采用 局 域 网 和 
广域网 连接 ,传输 速率 较 低 。@ 结 点 地 位 不 同 。 并 行 数据 库 中 的 各 个 结 点 不 是 独立 的 , 必 
须 在 数据 处 理 中 协同 作用 ,才能 实现 系统 功能 ;而 分 布 数据 库 系统 的 每 个 站 点 可 以 自治 ， 
有 独立 的 数据 库 系统 ,可 以 独立 完成 局 部 应 用 ,也 可 以 协同 完成 全 局 应 用 。 


17.6 空间 数据 库 


1. 空间 数据 库 的 定义 





空间 数据 库 (spatial database) 是 以 描述 空间 位 置 和 点 、 线 . 面 、 体 特征 的 位 置 数据 ( 空 
间 数 据 ) 以 及 描述 这 些 特征 的 属性 数据 ( 非 空间 数据 ) 为 对 象 的 数据 库 , 其 数据 模型 和 查询 
语言 能 支持 空间 数据 类 型 和 空间 索引 ,并 且 提 供 空间 查询 和 其 他 空间 分 析 方 法 。 

空间 数据 用 于 表示 空间 物体 的 位 置 . 形 状 、 大 小 和 分 布 特征 等 信息 ,用 于 描述 所 有 二 
维 、 三 维和 多 维 分 布 的 关于 区 域 的 信息 , 它 不 仅 表示 物体 本 身 的 空间 位 置 和 状态 信息 ,还 
能 表示 物体 之 间 的 空间 关系 。 非 空间 信息 主要 包含 表示 专题 属性 和 质量 的 描述 数据 ,用 
于 表示 物体 的 本 质 特征 。 因 此 ,凡是 需要 处 理 空间 数据 的 应 用 ,都 需要 建立 高 效 的 空间 数 
据 库 ,主要 应 用 领域 包括 如 下 。 

(1) 地 理 信息 系统 (GIS)。 在 GIS 中 ,需要 广泛 地 处 理 空间 数据 ,包括 点 、 线 、 两 维 或 
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者 三 维 区域 。 例 如 ,一 幅 地 图 包含 对 象 (点 ) .河流 和 高 速 公 路 ( 线 ) 以 及 城市 和 湖泊 ( 面 ) 的 
位 置 , 因 此 需要 数据 库 有 效 地 管理 这 些 数据 。 
(2) 计算 机 辅助 设计 和 制造 系统 。 如 所 要 设计 对 象 的 表面 ( 像 飞机 的 机 身 ) 。 


2. 空间 数据 的 分 类 


根据 空间 数据 的 特征 ,可 以 把 空间 数据 分 为 3 类 。 

(1) 属性 数据 : 描述 空间 数据 的 属性 特征 的 数据 ,也 称 为 非 几何 数据 ,如 类 型 等 级 、 

(2) 几何 数据 : 描述 空间 数据 的 空间 特征 的 数据 ,也 称 为 位 置 数 据 、 定 位 数据 ,如 用 
X.Y 坐标 来 表示 。 

(3) 关系 数据 : 描述 空间 数据 之 间 的 空间 关系 的 数据 ,如 空间 数据 的 相 邻 .包含 和 相 
交 等 ,主要 指 拓扑 关系 。 拓 扑 关系 是 一 种 对 空间 关系 进行 明确 定义 的 数学 方法 。 

为 了 将 空间 数据 及 其 属性 数据 有 效 地 组 织 和 管理 起 来 ,必须 建立 结构 合理 的 空间 数 
据 库 , 由 于 空间 数据 和 一 般 的 数据 不 完全 一 致 ,因此 ,空间 数据 库 的 设计 有 其 自身 的 特点 。 
它 主要 有 以 下 4 种 组 织 形式 。 

(1) 文件 与 关系 数据 库 混 合 型 组 织 形式 。 

用 关系 型 数据 库 管 理 系 统管 理 属性 数据 ,而 用 文件 管理 系统 管理 几何 图 形 数据 。 在 
这 种 管理 形式 中 ,属性 数据 与 几何 图 形 数 据 通 过 系统 内 部 生成 的 唯一 标识 符 进 行 关 联 。 

(2) 全 关系 数据 库 型 组 织 形式 。 

图 形 数据 和 属性 数据 都 用 关系 数据 库 管理 系统 进行 管理 。 

(3) 对 象 关系 型 数据 库 组 织 形式 。 

在 关系 型 数据 库 管 理 系统 的 基础 上 增加 了 对 面向 对 象 的 支持 ,这 种 方式 比较 好 地 兼 
容 异 构 数 据 的 访问 ,具有 对 空间 数据 类 型 和 海量 数据 的 兼容 ,又 具备 传统 关系 数据 库 管理 
系统 的 特点 ,因此 它 是 GIS 空间 数据 管理 的 主流 。 

(4) 面向 对 象 数据 库 组 织 形式 。 

面向 对 象 模型 最 适 于 空间 数据 类 型 的 管理 ,但 是 它 本 身 还 不 成 熟 、 价 格 昂贵 ,目前 在 
GIS 领域 还 不 通用 。 


3. 空间 查询 语言 的 分 类 


查询 语言 是 数据 库 管理 系统 中 的 核心 要 素 ,SQL 是 关系 型 数据 库 管理 系统 的 查询 语 
言 标准 。 那 么 ,在 空间 查询 请 言 的 设计 上 ,空间 查询 语言 大 体 分 为 : 基于 SQL 扩展 的 
空间 查询 语言 ,如 GSQL, 它 支持 空间 数据 类 型 .空间 数据 运算 符 、 空 间 关 系 运算 以 及 空间 
分 析 ; @ 可 视 化 查询 语言 , 它 主要 使 用 直观 的 图 符 等 来 表示 空间 概念 ,用 不 同 的 图 符 组 成 
空间 查询 语句 ,并 以 直观 的 图 、 表 、 多 媒体 等 形式 展现 查询 结果 ; @@ 自 然 查询 语言 3 种 方 
法 。 一 般 采 用 第 一 类 方法 描述 空间 数据 查询 。 常 用 的 空间 数据 查询 操作 有 精确 匹配 查 
询 ,点 查询 .空间 区 域 查询 、 最 临近 查询 。 为 了 提高 查询 效率 ,在 空间 数据 库 中 还 存在 多 种 
类 型 的 空间 数据 索引 。 

在 商用 数据 库 管理 系统 Oracle 和 SQL Server 中 都 由 空间 数据 库 组 件 来 存储 和 管理 
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空间 数据 ,如 Oracle Spatial 是 Oracle 从 版 本 8i 开始 推出 的 空间 数据 管理 组 件 , 它 负责 对 
空间 数据 进行 有 效 存储 、 获 取 以 及 分 析 的 操作 。SQL Server 从 2008 的 版 本 开始 提供 了 
全 面 性 的 空间 支持 。 


17.7 数据 仓库 与 数据 挖掘 


数据 仓库 是 一 种 数据 存储 和 组 织 技术 , 是 决策 分 析 的 基础 。 它 将 分 布 在 不 同 站 点 的 
相关 数据 集成 到 一 起 ,为 决策 者 提供 各 种 类 型 的 有效 的 数据 分 析 ,起 到 决策 支持 的 作用 。 

数据 挖掘 是 一 种 决策 支持 过 程 , 它 基于 多 学 科技 术 , 包 括 数据 库 技术 、 统 计 学 、 机 器 学 
习 , 信 息 科学 可视化 等 ,高 度 自动 化 地 分 析 原 有 的 数据 ,从 中 挖掘 出 潜在 的 模式 ,预测 未 
来 的 行为 。 

随 着 软 硬 件 技术 的 发 展 ,互联 网 、 电 子 商务 移动 网 络 .无线 网 络 、 物 联网 的 广泛 使 用 ， 
数据 量 爆炸 式 增长 ,人 们 对 数据 的 处 理 要 求 已 经 不 仅 满足 于 在 线 联 机 事务 处 理 (OLTP)， 
更 多 向 在 线 联 机 分 析 处 理 (OLAP) 转 变 , 并 逐步 向 数据 挖掘 及 大 数据 挖掘 扩展 。 


1. 数据 仓库 的 定义 及 相关 概念 


W. H. Inmon 提出 数据 仓库 是 一 个 面向 主题 的 ,集成 的 .时 变 的 、 非 易 失 的 数据 集合 ， 
支持 管理 决策 制定 。 数 据 仓库 围绕 一 些 主 题 ,如 顾客 、 供 应 商 , 产 品 和 销售 组 织 。 数 据 仓 
库 关 注 的 内 容 不 再 是 日 常 操作 和 事务 处 理 ,而 是 决策 者 的 数据 建 模 与 分 析 。 数 据 仓库 将 
多 个 异种 数据 源 经 过 抽取 、 清 洗 、 转 换 、 集 成 在 一 起 。 保 存 的 数据 多 是 历史 性 的 数据 , 它 与 
日 常 操作 的 事务 数据 分 开 存放 。 

通过 数据 仓库 上 的 联机 分 析 处 理 ,更 多 关注 的 是 支持 决策 活动 的 信息 ,如 顾客 购买 模 
式 包 括 喜 爱 买 什么 ,购买 时 间 、 消 费 习 惯 ,根据 季度 、 年 .地 区 的 营销 情况 比较 ,重新 配置 产 
品 和 投资 ,调整 生成 策略 ,管理 顾客 关系 ,如 哪些 产品 最 受 15 一 20 岁 女 性 欢迎 ,病房 花 在 
每 个 患者 身上 的 成 本 和 时 间 是 多 少 等 。 


2. 数据 仓库 的 体系 结构 


数据 仓库 通常 采用 4 层 结构 ,如 图 17. 8 所 示 , 它 由 ETL 工具 (数据 提取 清洗、 转换 、 
装 和 人 、 刷 新 ) .数据 仓库 服务 器 .OLAP 服务 器 .前 端 工具 组 成 。 

数据 仓库 的 数据 来 源 经 常 是 异地 异 构 异 种 数据 源 ,如 记事 本 、Excel、 关 系数 据 库 、 非 
关系 数据 库 等 ,只 能 通过 ETL(Extract Transform Load) 工 具 抽 取 、 清 洗 、 转 换 ,形成 统一 
的 格式 装 人 到 数据 仓库 中 。 

数据 仓库 服务 器 相当 于 管理 数据 库 的 系统 , 它 负责 数据 仓库 中 数据 的 存储 管理 和 存 
取 , 并 为 上 层 服 务 提供 接口 。 目 前 ,数据 仓库 服务 器 一 般 是 关系 数据 库 管理 系统 或 者 扩展 
的 关系 数据 库 管理 系统 。 

OLAP 服务 器 为 上 层 服务 提供 多 维 数据 视图 和 操作 。 项 层 是 前 端 工具 ,包括 查询 和 
报表 工具 、 分 析 工 具 、 数 据 挖掘 及 结果 可 视 化 工具 等 。 
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查询 /报告 分 析 数据 挖掘 
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操作 数据 库 附加 的 数据 
图 17.8 数据 仓库 的 体系 结构 


3. 数据 仓库 的 设计 方法 


数据 仓库 的 设计 方法 和 数据 库 的 设计 方法 类 似 ,大 体 上 分 为 以 下 6 个 步骤 。 

(1) 需求 分 析 。 收 集 相关 信息 ,理解 系统 信息 结构 ,了 解 用 户 需 求 。 

(2) 概念 模型 设计 。 这 一 阶段 的 工作 类 似 于 数据 库 设 计 的 概念 模型 设计 。 其 主要 任 
务 是 确定 系统 边界 ,确定 数据 仓库 的 主题 及 内 容 , 一 般 用 E-R 图 表示 法 描述 实体 及 实体 
之 间 的 联系 。 

(3) 逻辑 模型 设计 。 这 一 阶段 的 任务 主要 是 确定 主题 和 维度 信息 ,确定 粒度 层次 划 
分 ,确定 数据 分 割 策略 ,以 及 关系 模式 定义 。 它 实际 就 是 把 不 同 主题 和 维度 的 信息 映射 到 
数据 仓库 中 的 具体 表 。 

(4) 物理 模型 设计 。 设 计数 据 的 存放 形式 和 组 织 形式 ,确定 数据 的 存储 结构 、 存 放 位 
置 、 存 取 方 法 、 存 储 分 配 。 

(5) 数据 仓库 实施 。 数 据 仓库 的 生成 ,数据 装 入 。 

(6) 数据 仓库 的 使 用 和 维护 。 使 用 数据 仓库 调整 和 完善 系统 ,维护 数据 仓库 。 
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4. OLAP 


联机 分 析 处 理 (OLAP) 是 以 海量 数据 为 基础 ,基于 数据 仓库 的 信息 分 析 处 理 过 程 。 

OLAP 工具 基于 多 维 数据 模型 。 多 维 数据 模型 如 图 17. 9 所 示 , 某 种 产品 某 季度 在 每 个 地 

区 的 销售 数量 。 多 维 数据 模型 由 维和 事实 表 构 成 。 每 个 维 对 应 于 一 个 表 , 叫 维 表 。 多 维 

数据 模型 围绕 中 心 主题 组 织 ,该 主题 用 事实 表 表 示 。 事 实 表 包含 事实 的 名 称 和 度量 值 ,以 

及 每 个 相关 维 表 的 关键 字 , 在 图 17. 9 中 有 城市 维 、 时 间 维 、 产 品 维 ,605 表示 家 庭 娱 乐 产 
品 Ql 季度 在 温哥华 的 销售 数量 。 

芝加哥 

纽约 

蒙特 利 尔 

温哥华 























Ql 605 825 14 400 





时 间 。 Q2 











Q3 





























家 庭 娱乐 ”计算 机 ”电话 ”安全 
产品 
图 17.9 多 维 数据 模型 


多 维 数据 模型 常 以 星 形 模式 雪花 模式 、 事 实 星座 模式 存在 。 

星 形 模式 由 一 个 事实 表 及 一 组 维 表 构成 ,类 似 星 形 。 如 图 17. 10 所 示 , 每 个 维 只 用 一 
个 表 表 示 ,包含 一 组 属性 ,该 图 描述 的 是 销售 数据 ,表示 某 产品 在 某 时 间 、 某 地 区 每 个 销售 
员 销 售 给 不 同 客户 的 销售 数量 ,图 中 有 6 个 维 , 它 们 是 产品 订单、 销售 员 、 客 户 、. 地 区 名 
称 .日 期 标示 ,分 别 有 一 组 属性 对 这 6 个 维 进行 描述 。 

雪花 模式 在 星 形 模式 的 基础 上 , 维 表 可 以 进行 进一步 分 解 。 如 图 17. 11 所 示 ,产品 维 
中 的 公司 属性 进一步 由 属性 “公司 名 称 ” 和 “地 址 ”描述 。 

常用 的 OLAP 操作 有 切片 . 切 块 、 旋 转 、 上 卷 . 下 钻 等 。 通 过 这 些 操作 ,用户 可 以 深入 
观察 .分析 数据 ,从 而 获取 包含 在 数据 里 的 信息 。 


5. 数据 挖掘 的 定义 


到 底 什么 是 数据 挖掘 呢 ? 它 除 了 可 以 解答 某 种 现象 为 什么 发 生 , 还 可 以 解答 未 来 将 
会 发 生 什么 。 
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订单 号 


订货 日 期 











图 17.10 星 形 模式 


公司 代码 
公司 名 称 
地 址 

















图 17.11 雪花 模式 


数据 挖掘 是 从 大 量 数据 中 发 现 并 提取 隐藏 在 内 的 .人 们 事先 不 知道 的 ,但 又 可 能 有 用 
的 信息 和 知识 的 一 种 新 技术 。 

数据 挖掘 的 数据 主要 有 两 种 来 源 , 既 可 以 来 自 数据 仓库 ,也 可 以 来 自 数据 库 。 而 这 些 
数据 往往 是 不 完全 的 、 有 噪声 的 ,模糊 的 、 随 机 的 ,因此 ,在 数据 挖掘 前 一 般 都 需要 对 数据 
进行 预 处 理 , 如 清洗 ,转换 等 。 数 据 挖掘 过 程 如 图 17. 12 所 示 。 

(1) 数据 清洗 : 消除 噪声 或 不 一 致 数据 。 

(2) 数据 集成 : 多 种 数据 源 组 合 在 一 起 。 

(3) 数据 选择 : 从 数据 库 中 提取 与 分 析 任 务 相关 的 数据 。 

(4) 数据 变换 : 数据 变换 或 统一 成 适合 挖掘 的 形式 。 

(5) 数据 挖掘: 使 用 挖掘 算法 提取 数据 模式 。 

(6) 模式 评估 : 根据 某 种 兴趣 度 度量 ,识别 提供 知识 的 真正 有 趣 的 模式 。 

(7) 知识 表示 : 使 用 可 视 化 和 知识 表示 技术 向 用 户 提供 挖掘 的 知识 。 
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模式 评估 


预 处 理 后 的 数据 


wi NN 人 | 
| | | 
数据 准备 数据 挖掘 结果 表达 和 解释 
图 17.12 数据 挖掘 过 程 





6. 数据 挖掘 的 算法 


在 数据 挖掘 过 程 中 ,其 挖掘 算法 主要 有 以 下 4 类 。 
(1) 关联 分 析 。 

(2) 分 类 和 预测 。 

(3) 聚 类 分 析 。 

(4) 复杂 数据 的 挖掘 。 


7. 大 数据 上 的 数据 挖掘 
目前 ,大 数据 时 代 对 数据 挖掘 又 提出 了 新 的 机 遇 和 挑战 。 数 据 量 的 剧 增 给 数据 挖掘 


提供 数据 基础 的 同时 ,如 何 存 储 、 管 理 , 快 速 分 析 及 挖掘 这 些 大 数据 又 成 了 新 的 问题 ,数据 
类 型 的 多 样 化 及 复杂 化 给 数据 挖掘 提出 新 的 难题 。 因 此 ,针对 大 数据 的 存储 等 问题 ,大 数 
据 时 代 对 数据 挖掘 体系 结构 提出 新 的 改进 。 


17.8 大 数据 


科技 界 和 工业 界 正在 研究 大 数据 理论 和 技术 以 及 开发 大 数据 系统 ,正在 孕育 新 的 数 


据 学 科 , 正 在 形成 新 的 产业 , 它 将 给 人 们 带 来 无 穷 的 ,变化 的 ,灿烂 的 前 景 。 不 管 是 大 数据 
理论 ,还 是 技术 .系统 及 应 用 ,都 还 没有 成 熟 , 这 些 内容 将 会 不 断 地 被 更 新 发展 ,最 终 形成 





326| 











数据 库 的 发 展 及 新 技术 


新 的 标准 体系 。 
1. 大 数据 概述 


数据 的 发 展 从 20 世纪 70 年 代 出 现 的 超大 规模 数据 库 (Very Large DataBase， 
VLDB) 里 保存 了 数 百 万 条 数据 ,到 21 世纪 初 更 大 数据 集 及 更 丰富 数据 类 型 的 “海量 数 
据 ?, 再 到 如 今 ,数据 已 经 渗透 到 每 个 行业 和 业务 职能 领域 。 随 着 互联 网 、 移 动 互联 网 、 物 
联网 大 潮 的 高 速 发 展 以 及 IT 技术 的 快速 进步 ,很 多 企业 正面 临海 量 的 交易 数据 ,顾客 信 
息 . 供 货 商 信息 和 运营 数据 等 :传感器 .智能 手机 、 工 业 设备 等 都 产生 了 海量 数据 ;用 户 访 
问 网 站 的 海量 点 击 记 录 数 据 ; 电 子 商 务 网 站 的 在 线 购 买 记录 、 通 信 数 据 .RFID( 无 线 射频 
识别 )、 多 媒体 数据 .医疗 数据 、 微 博 数据 ,社交 网 络 数据 等 。2008 年 9 月 , Nature 杂志 推 
出 了 “大 数据 "专刊 ,通过 多 篇 文章 全 方位 介绍 了 大 数据 问题 的 产生 及 对 各 个 研究 领域 的 
影响 ,首次 将 “大 数据 ”这 一 概念 引入 科学 家 和 研究 人 员 的 视野 。 


2. 大 数据 的 定义 


维基 百科 对 大 数据 的 定义 : 大 数据 是 指 其 大 小 或 复杂 性 无 法 通过 现 有 常用 的 软件 工 
具 以 合理 的 成 本 并 在 可 接受 的 时 限 内 对 其 进行 获取 、 管 理 和 处 理 的 数据 集 。 这 些 困难 包 
括 数据 的 收录 、 存 储 、 搜 索 .共享 .分 析 和 可 视 化 。 

专家 对 大 数据 的 定义 : 大 数据 通常 被 认为 是 PB(10*TB) 、EB(10sTB) 或 更 高 数量 级 
的 数据 ,包括 结构 化 的 、 半 结构 化 的 和 非 结 构 化 的 数据 。 

Gartner 咨询 公司 IBM、 微 软 .SAS 公司 等 分 别 都 给 出 了 大 数据 的 定义 。 总 结 起 来 ， 
大 数据 应 该 包含 4 个 V 特征 。 

第 一 个 VCVolume) : 大 规模 。 统 计数 据 表 明 ,2010 年 全 世界 信息 总 量 是 1ZB(1ZB= 
1 兆 GB) ,最 近 3 年 人 类 产生 的 信息 量 已 经 超过 之 前 历史 上 人 类 产生 的 所 有 信息 之 和 ; 
Twitter 一 天 产生 1.9 亿 条 微 博 ;搜索 引擎 一 天 产生 的 日 志高 达 35TB;Google 一 天 处 理 
的 数据 量 超过 25PB;YouTube 一 天 上 传 的 视频 总 时 长 为 5 万 小 时 等 。 

第 二 个 VCVelocity) : 高 速度 ,主要 指数 据 实时 性 。 数 据 到 达 的 速度 快 、 处 理 时 间 短 、 
响应 快 ,具有 强 时 效 性 。 

第 三 个 V(Variety): 多 样 化 , 越 来 越 多 的 应 用 产生 的 数据 不 再 是 结构 化 的 关系 数据 ， 
更 多 的 是 半 结 构 化 、 非 结构 化 数据 ,如 文本 、 图 形 、 图 像 、 音 频 、 视 频 、 网 页 、 博 客 等 。 至 
2012 年 年 末 , 非 结构 化 数据 占 整 个 数据 量 的 比例 为 75% 以 上 。 

第 四 个 VCValue) : 价值 。 大 数据 中 蕴藏 着 大 价值 。 早 在 1980 年 ,有 人 就 提出 “数据 
就 是 财富 ”。 

也 正 是 因为 大 数据 有 以 上 特征 ,所 以 给 我 们 现存 的 数据 存储 数据 处 理 、 数 据 管理 . 数 
据 分 析 技术 提出 了 挑战 和 新 的 课题 。 

从 内 存 容量 、 硬 盘 容 量 、 处 理 器 速度 等 物理 硬件 的 性 能 上 考虑 ,可 以 采用 一 主 多 从 的 
集中 式 数 据 存储 管理 系统 ,如 Google 的 BigTable, 但 更 多 的 是 采用 无 主 从 结 点 之 分 的 分 
布 式 并 行 架构 的 非 集中 式 数 据 存储 管理 系统 ,如 集群 、 云 存储 (如 Amazon 的 Dynamo)。 

传统 的 数据 管理 技术 已 经 无 法 管理 海量 半 结 构 化 、 结 构 化 的 数据 ,因此 ,需要 开发 出 
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高 并 发 .高 性 能 ,高 可 用 新 的 数据 库 系统 ,如 NoSQL NewSQL 等 。 

海量 数据 处 理 的 方法 中 ,MapReduce 是 最 流行 的 处 理 方法 之 一 , 它 是 Google 公司 的 
核心 计算 模型 , 它 将 复杂 的 运行 于 大 规模 集群 上 的 并 行 计算 过 程 高 度 地 抽象 为 Map 和 
Reduce 两 个 函数 。 

同样 ,大 数据 对 传统 的 数据 分 析 提出 了 新 的 要 求 。 传 统 的 数据 分 析 算法 对 处 理 同 构 
的 关系 数据 比较 成 熟 ,而 对 非 结 构 化 、 半 结构 化 的 数据 不 一 定 适用 等 。 

因此 ,目前 大 数据 各 种 相关 技术 (包括 存储 、 分 区 、 复 制 与 容错 \ 压 缩 \ 缓 存 、 数 据 处 理 、 
分 析 等 ) 都 处 于 积极 发 展 时 期 ,都 还 没有 很 成 熟 的 理论 ,是 蝇 待 大 家 努力 去 发 展 的 学 科 。 

随 着 NoSQL、NewSQL 数据 库 的 迅速 崛起 ,针对 市 场 上 大 数据 数据 库 管 理 系 统 进 行 
调查 ,当今 数据 库 系统 “百花 齐 放 ”, 现 有 数据 库 管理 系统 达 数 百 种 之 多 。 图 17. 13 为 数据 
库 系统 新 格局 ,主要 分 为 非 关 系 分 析 型 数据 库 管 理 系统 、 关 系 分 析 型 数据 库 管 理 系统 、 关 
系 操作 型 数据 库 管 理 系 统 、 非 关系 操作 型 数据 库 管理 系统 、 数 据 库 缓 存 系统 5 类 。 其 中 ， 
非 关系 操作 型 数据 库 管理 系统 主要 指 的 是 NoSQL ,分 为 键 值 数 据 库 、 列 式 存储 数据 库 、 图 
形 存储 数据 库 以 及 文档 数据 库 4 大 类 ;除了 传统 的 关系 型 数据 库 管理 系统 外 ,关系 操作 型 
数据 库 管 理 系 统 主要 还 包括 NewSQL 数据 库 管理 系统 。 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 、 




















































一 、 
’ \ 
天 非 关系 数据 模型 关系 数据 模型 \ 
! (NosQL) (Relational) \ 

1 
| | 
MapReduce | cloudEra 并 行 数据 库 系 统 | TeraData/EMC | 
| ”分析 型 应 用 (Dryad) | Splunk 列 存 储 的 RDBMS | Inforbright/LucidDB 1 
| (Analytics) Karmashpere infiniDB | 
| MapR MonatDB 1 
| 系 绚 | Vertica | 
| | 
| | 
| | 
lL | 
| | 
| | 
| KeyValue |Cassandra IBM/Oracle/SQL Server | | 
| Coluanar |Hbase,Bis Teble \ Postgresql/MySQL 1 
Document “| MongcDB 并 行 数 据 库 系统 | Oracle RAC | 
| 操作 型 应 用 Graph Infinite Graph 面 可 oOLTE 的 | AltiBase | 
| (Operational) Neo4]J 内 存 数据 库 系统 | ExtremeDB 1 
| Timesten | 
1 NevsQL VoltDB 1 
| Clustrix/NuoDB | 
I --- 1 
\ / 

\ / 
和 数据 库 缓存 系统 eacached microsoft velocity Bp, 
17.13 数据 库 系 统 新 格局 
3. NoSQL 


NoSQL 有 两 种 解释 : 一 种 是 非 关系 数据 库 ; 一 种 是 Not Only SQL, 不 仅仅 是 SQL。 
NoSQL 数据 库 系统 支 持 的 数据 模型 通常 分 为 键 值 模型 文档 模型 .图 模型 . 列 式 存 储 模 
型 。NoSQL 系统 为 了 提高 存储 能 力 和 并 发 读 写 能 力 ,采用 简单 的 数据 模型 ,支持 简单 的 
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数据 库 的 发 展 及 新 技术 


查询 操作 ,把 复杂 的 操作 留 给 应 用 层 实 现 。NoSQL 系统 在 体系 结构 数据 存储 、 数 据 模 
型 . 读 写 方式 索引 技术 ,事务 特性 、 动 态 负 载 均 衡 策 略 ,副本 管理 策略 .数据 一 致 性 策略 上 
和 传统 关系 型 数据 库 完全 不 同 。 


4. NewSQL 


NewSQL 是 对 各 种 新 的 可 扩展 、 高 性 能 的 SQL 数据 库 的 简称 , 它 把 关系 模型 的 优势 
发 挥 到 分 布 式 体系 结构 中 。 从 一 开始 就 将 SQL 功能 考虑 在 内 ,并 且 精 简 传 统 关系 数据 库 
中 不 必要 的 组 件 , 提 高 执行 效率 ,可 以 完整 无 缝 地 替换 原 有 系统 的 关系 数据 库 。NewSQL 
将 SQL 与 NoSQL 的 优势 结合 起 来 ,支持 高 扩展 性 .SQL 语句 .ACID 一 致 性 约束 、 高 可 
用 性 、Hadoop 集成 等 。 典 型 的 代表 有 MySQL Cluster, 它 是 MySQL 的 集群 版 本 , 既 适 合 
高 可 用 集群 ,也 适合 高 性 能 计算 集群 。 


17.9 ”小结 


本 章 介绍 了 数据 库 系 统 发 展 的 特点 及 数据 管理 技术 发 展 的 趋势 ,简单 讲述 了 面向 对 
象 数据 库 管理 系统 、 对 象 关系 型 数据 库 管理 系 统 、 分 布 式 数据 库 、 并 行 数据 库 、 空 间 数据 
库 、 数 据 仓库 ,数据 挖掘 、 大 数据 等 基本 概念 。 


17.10 习题 


. 查找 资料 ,了 解 非 关系 数据 模型 的 市 场 占有 情况 。 

. 查找 资料 ,了 解 非 关系 数据 库 的 设计 过 程 。 

.查找 资料 ,了 解 大 数据 的 应 用 情况 。 

. 列 出 几 种 常用 的 数据 挖掘 算法 ,并 给 出 其 使 用 的 环境 。 
. 选择 一 种 非 关系 型 数据 库 管理 系统 ,下 载 并 安装 使 用 。 


an 性 
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